EagleBear2002 的博客

这里必须根绝一切犹豫,这里任何怯懦都无济于事

离线数据

通过时间维度展示贷款账户汇总信息的变化趋势,以便了解不同指标在不同时间段的表现和变化情况,以指导贷款业务的后续发展。

  1. 总余额:反映当前贷款账户总体规模的大小
  2. 不良余额:反映不良贷款的总体规模,可以作为资产质量的一个指标
  3. 欠息总额:反映当前贷款账户欠息的总体规模
  4. 正常余额:反映当前贷款账户正常的总体规模
  5. 逾期总额:反映当前贷款账户逾期的总体规模

流式数据

阅读全文 »

A huge number of informal messages are posted every day in social network sites, blogs and discussion forums. Emotions seem to be frequently important in these texts for expressing friendship, showing social support or as part of online arguments. Algorithms to identify sentiment and sentiment strength are needed to help understand the role of emotion in this informal communication and also to identify inappropriate or anomalous affective utterances, potentially associated with threatening behaviour to the self or others. Nevertheless, existing sentiment detection algorithms tend to be commercially-oriented, designed to identify opinions about products rather than user behaviours. This article partly fills this gap with a new algorithm, SentiStrength, to extract sentiment strength from informal English text, using new methods to exploit the de-facto grammars and spelling styles of cyberspace. Applied to MySpace comments and with a lookup table of term sentiment strengths optimised by machine learning, SentiStrength is able to predict positive emotion with 60.6% accuracy and negative emotion with 72.8% accuracy, both based upon strength scales of 1-5. The former, but not the latter, is better than baseline and a wide range of general machine learning approaches.

每天在社交网站、博客和论坛上都会发布大量非正式消息。 在这些文本中,情感似乎对于表达友谊、显示社会支持或作为在线争论的一部分很重要。 需要识别情绪和情绪强度的算法来帮助理解情绪在这种非正式交流中的作用,并识别不恰当或异常的情感表达,这些表达可能与对自己或他人的威胁行为有关。 尽管如此,现有的情绪检测算法往往是面向商业的,旨在识别对产品的看法而不是用户行为。 本文使用新算法 SentiStrength 部分填补了这一空白,该算法使用新方法从非正式英语文本中提取情感强度,利用网络空间的实际语法和拼写风格。 应用于 MySpace 评论和通过机器学习优化的术语情绪强度查找表,SentiStrength 能够以 60.6% 的准确度预测积极情绪,以 72.8% 的准确度预测消极情绪,两者均基于 1-5 的强度等级。 前者,而不是后者,优于基线和广泛的通用机器学习方法。

Introduction

Most opinion mining algorithms attempt to identify the polarity of sentiment in text: positive, negative or neutral. Whilst for many applications this is sufficient, texts often contain a mix of positive and negative sentiment and for some applications it is necessary to detect both simultaneously and also to detect the strength of sentiment expressed. For instance, programs to monitor sentiment in online communication, perhaps designed to identify and intervene when inappropriate emotions are used or to identify at-risk users (e.g., Huang, Goh, & Liew, 2007), would need to be sensitive to the strength of sentiment expressed and whether participants were appropriately balancing positive and negative sentiment. In addition, basic research to understand the role of emotion in online communication (e.g., Derks, Fischer, & Bos, 2008; e.g., Hancock, Gee, Ciaccio, & Lin, 2008; Nardi, 2005) would also benefit from fine-grained sentiment detection, as would the growing body of psychology and other social science research into the role of sentiment in various types of discussion or general discourse (Balahur, Kozareva, & Montoyo, 2009; Pennebaker, Mehl, & Niederhoffer, 2003; Short & Palmer, 2008).

大多数意见挖掘算法都试图识别文本中情绪的极性:正面、负面或中性。 虽然对于许多应用程序来说这已经足够了,但文本通常包含正面和负面情绪的混合,对于某些应用程序,有必要同时检测两者并检测表达的情绪强度。 例如,监控在线交流情绪的程序可能旨在识别和干预何时使用不当情绪或识别处于风险中的用户(例如,Huang、Goh 和 Liew,2007 年),需要对强度敏感 表达的情绪以及参与者是否适当地平衡了正面和负面情绪。 此外,了解情绪在在线交流中的作用的基础研究(例如,Derks、Fischer 和 Bos,2008 年;例如,Hancock、Gee、Ciaccio 和 Lin,2008 年;Nardi,2005 年)也将受益于细粒度的 情绪检测,以及越来越多的心理学和其他社会科学研究,研究情绪在各种类型的讨论或一般话语中的作用(Balahur、Kozareva 和 Montoyo,2009 年;Pennebaker、Mehl 和 Niederhoffer,2003 年;Short 和 Palmer , 2008).

阅读全文 »

观察者模式

模式动机

  • 目前有一个 WeatherData 对象,可以从气象站获取天气状况(温度、适度、气压等)
  • 希望能建立一个应用,有三种布告板,分别显示目前的天气状况、气象统计及天气预报
  • 三种布告板必须实时更新
  • 需要公布一组 API ,供开发者写出自己的气象公告板

我们的工作就是建立一个应用, 利用 WeatherData 对象取得数据,并更新三个布告板:目前状况、气象统计和天气预报。

阅读全文 »

“青年马克思”:一段思想史上的公案

《1844 年经济学哲学手稿》的产生、发现和流传

1843 年 10 月份,马克思一家迁居巴黎。到了“这个古老的哲学大学和新世界的新首府”之后,马克思不仅同各个流派的思想家展开了广泛的交流,而且还直接深入工厂,参加工人的革命活动。也正是在这一过程中,在马克思面前敞开了一个全新的理论视域:政治经济学。受恩格斯、蒲鲁东和赫斯的直接影响,马克思从 1843 年底开始,第一次系统地研究经济学著作,作为研究成果的是《巴黎笔记》以及三个相对独立的笔记本,这三个相对独立的笔记本就是我们所说的《1844 年经济学哲学手稿》。在每一个笔记本中,马克思自己都对页码进行了编号,这也为我们理解《1844 年经济学哲学手稿》的写作过程留下了重要线索。

1840 年代的巴黎

第一个笔记本的写作十分特殊,从纸张的角度来看,第一笔记本的 27 页都以竖线分开,分栏写作。但是在最初的部分,页面被马克思用两道竖线分为三栏,这三栏被马克思分别标上了“工资”、“资本的利润”和“地租”这三个标题。有趣的是,从第 22(XXII)页开始,尽管仍然保留了分栏,但马克思讨论的内容却是统一的,这一部分也被后来的编辑者冠以“异化劳动和私有财产”的标题。也正是在这一部分中马克思提出并集中阐述了他对“异化劳动”的理解。

阅读全文 »

今天为什么还要读马克思?

1883 年 3 月 14 日下午两点三刻,马克思在伦敦的寓所安详离世,享年 65 岁。在三天后举行的葬礼上,他的终生朋友与合作者恩格斯预言:“他的英名和事业将永垂不朽!”[^1] 历史已经证明这一预言是多么的正确。1999 年和 2005 年,英国广播公司(BBC)曾分别举办 “千年思想家”和“古今最伟大哲学家”调查,马克思均名列第一。这些充分说明了马克思在人类历史特别是思想史上的位置。

英国广播公司(BBC)于 1999 年和 2005 年发起的投票结果

千年思想家 古今最伟大哲学家
1 马克思 马克思
2 爱因斯坦 休谟
3 牛顿 维特根斯坦
4 达尔文 尼采
5 托马斯·阿奎那 柏拉图
6 斯蒂芬·霍金 康德
7 康德 托马斯·阿奎那
8 笛卡尔 苏格拉底
9 詹姆斯·麦克斯韦 亚里士多德
10 尼采 卡尔·波普

按照历史学家的说法,马克思生活在“维多利亚时代(1837-1901)”。于是,人们不禁会问:100 多年过去了,曾经的“日不落帝国”早已是昨日黄花,马克思还没有过时吗?换种问法,在 21 世纪的今天,我们为什么还要读马克思呢?

阅读全文 »

状态模式

模式动机

  1. 在很多情况下,一个对象的行为取决于一个或多个动态变化的属性,这样的属性叫做状态,这样的对象叫做有状态的(stateful)对象,这样的对象状态是从事先定义好的一系列值中取出的。当一个这样的对象与外部事件产生互动时,其内部状态就会改变,从而使得系统的行为也随之发生变化。
  2. 在 UML 中可以使用状态图来描述对象状态的变化。

模式定义

阅读全文 »

原文:中华人民共和国国史学会出版《毛泽东读社会主义政治经济学批注和谈话》(1998 年)


苏联《政治经济学教科书》原文:

由于社会主义革命的胜利,中国生产力发展道路上的一切障碍基本上扫除了。社会主义改造完成以后,在中国产生了先进的社会制度和落后的社会生产力之间的矛盾。在当前条件下,中国人民正集中全力解决这个矛盾,以便尽快地把中国由落后的农业国变成先进的工业国。任务是在 10 年至 15 年内,把中国变成拥有现代工业、现代农业和现代科学文化的强大的社会主义国家。

在中国的特殊条件下,社会主义能在国家工业化实现以前,就在所有制方面(包括农村在内)取得胜利,是因为有强大的社会主义阵营存在,有苏联这样高度发展的工业国家的援助。


阅读全文 »

建造者模式

模式动机

无论是在现实世界中还是在软件系统中,都存在一些复杂的对象,它们拥有多个组成部分,如汽车,它包括车轮、方向盘、发送机等各种部件。而对于大多数用户而言,无须知道这些部件的装配细节,也几乎不会使用单独某个部件,而是使用一辆完整的汽车,可以通过建造者模式对其进行设计与描述,建造者模式可以将部件和其组装过程分开,一步一步创建一个复杂的对象。用户只需要指定复杂对象的类型就可以得到该对象,而无须知道其内部的具体构造细节。

在软件开发中,也存在大量类似汽车一样的复杂对象,它们拥有一系列成员属性,这些成员属性中有些是引用类型的成员对象。而且在这些复杂对象中,还可能存在一些限制条件,如某些属性没有赋值则复杂对象不能作为一个完整的产品使用;有些属性的赋值必须按照某个顺序,一个属性没有赋值之前,另一个属性可能无法赋值等。

阅读全文 »