您的位置 主页 正文

机器学习与反洗钱

一、机器学习与反洗钱 机器学习与反洗钱 是当今金融领域中备受关注的话题之一。随着科技的飞速发展,金融犯罪活动也日益猖獗,传统手段已经难以应对这种挑战。因此,许多金融

一、机器学习与反洗钱

机器学习与反洗钱是当今金融领域中备受关注的话题之一。随着科技的飞速发展,金融犯罪活动也日益猖獗,传统手段已经难以应对这种挑战。因此,许多金融机构开始着眼于利用机器学习技术来帮助防范和打击洗钱行为。

机器学习的优势

机器学习在反洗钱领域中具有诸多优势,其中之一就是其能够处理大规模和复杂的数据集。洗钱活动往往涉及到大量的交易数据和资金流向,传统手段很难从中找出规律和模式。而机器学习算法可以通过对这些数据的分析和挖掘,发现隐藏在其中的关联性和异常情况,从而帮助金融机构及时发现可疑交易。

此外,机器学习还能够根据历史数据和模式进行预测,进一步提高监测的准确性和效率。通过不断学习和优化模型,系统可以不断提升自身的识别能力,及时应对新的洗钱手段和方式。

应用场景

机器学习在反洗钱领域的应用场景非常广泛。比如,可以利用机器学习算法对大量的交易数据进行筛查,识别其中的异常交易和可疑行为。同时,还可以通过建立客户的交易模式和行为特征,及时发现与其正常行为不符的交易,防止洗钱分子利用冒用账户进行交易。

此外,机器学习还可以帮助识别关联交易和链式洗钱行为,通过分析交易之间的关系和模式,揪出隐藏在这些交易背后的洗钱网络,为打击犯罪活动提供有力支持。

挑战与应对

然而,机器学习在反洗钱领域的应用也面临着一些挑战。比如,数据的质量和完整性对于机器学习算法的准确性至关重要。如果数据存在缺失、错误或者不完整的情况,将会影响机器学习模型的训练和预测结果。因此,金融机构需要加强对数据的采集、清洗和管理,确保数据的质量和准确性。

此外,还有一个重要的挑战是模型的解释性。机器学习模型往往是一个黑盒子,难以解释其内部的决策过程和推理逻辑。在反洗钱领域,监管机构和金融机构需要清楚地了解模型是如何判断一个交易为可疑或者正常的,以便进行审计和监督,确保模型的公平性和准确性。

未来发展

随着人工智能和机器学习技术的不断发展和完善,机器学习在反洗钱领域的应用前景将会更加广阔。未来,机器学习算法将会更加智能化和自适应,能够更好地应对金融犯罪活动的变化和复杂性。同时,金融机构也需要加强对人才的培养和引进,建立强大的机器学习团队,以应对未来挑战。

总的来说,机器学习在反洗钱领域的应用是一种创新而有效的手段,可以帮助金融机构提高反洗钱监测的准确性和效率,有效应对日益严峻的金融犯罪挑战。

二、对抗机器学习应用前景?

对抗机器学习在未来有广泛的应用前景。 它可以用于以下几个方面:

 

1. 网络安全:通过对抗机器学习技术,可以检测和防御针对机器学习系统的攻击,保护系统的安全性和可靠性。

2. 数据隐私保护:利用对抗机器学习技术,可以对敏感数据进行加密或匿名化处理,保护数据的隐私性。

3. 模型评估和鲁棒性增强:对抗机器学习可以用于评估机器学习模型的鲁棒性,并通过对抗训练等方法提高模型的抗干扰能力。

4. 反欺诈和防伪:在金融、电商等领域,对抗机器学习可以帮助识别和防范欺诈行为,保证交易的安全性。

5. 人工智能安全:随着人工智能技术的广泛应用,对抗机器学习将在确保人工智能系统的安全性和可靠性方面发挥重要作用。

 

总的来说,对抗机器学习的应用前景非常广阔,它将为各个领域的安全和防御提供有力的技术支持。

三、机器学习在机械加工中的应用?

机器学习在机械加工中应用广泛,包括预测性维护、优化切削参数、提高刀具寿命、减少废品率等。

通过对历史加工数据的学习和分析,机器学习算法可以预测未来的加工效果,从而提前采取措施,提高加工效率和产品质量。

四、材料学研究哪些应用了机器学习?

部分由材料基因组计划推动,部分由算法发展和其他领域数据驱动努力的巨大成功推动,信息学战略开始在材料科学中形成。这些方法导致了替代机器学习模型的出现,该模型能够完全基于过去的数据进行快速预测,而不是通过直接实验或显式求解基本方程的计算/模拟。以数据为中心的信息学方法正变得越来越有用,可用于确定材料的属性,这些属性由于涉及成本、时间或精力而难以用传统方法测量或计算,但这些属性的可靠数据要么已经存在,要么至少可以为关键案例的子集生成。预测通常是内插式的,首先用数字方法对材料进行指纹识别,然后在指纹和感兴趣的属性之间建立映射(通过学习算法建立)。指纹,也称为描述符,可以是多种类型和规模,由应用程序领域和需求决定。如果预测的不确定性得到适当的考虑,预测也可以外推到新材料空间。本文试图概述最近十年来一些成功的数据驱动材料信息学策略,特别强调指纹或描述符的选择。

五、高斯分布在机器学习的应用?

现在的应用包括监督学习,非监督学习,主动学习,多任务学习,强化学习,时间序列建模等等

六、机器学习包括?

机器学习

机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

七、什么是学习和机器学习?

机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是人工智能的核心,是使计算机具有智能的根本途径。

学习,是指通过阅读、听讲、思考、研究、实践等途径获得知识和技能的过程。学习分为狭义与广义两种:狭义:通过阅读、听讲、研究、观察、理解、探索、实验、实践等手段获得知识或技能的过程,是一种使个体可以得到持续变化(知识和技能,方法与过程,情感与价值的改善和升华)的行为方式。例如:通过学校教育获得知识的过程。广义:是人在生活过程中,通过获得经验而产生的行为或行为潜能的相对持久的方式。次广义学习指人类的学习。

八、机器学习是从哪里学习?

机器学习是从数据中学习的。它利用算法和统计模型来分析数据,发现数据中的模式和规律,从而生成预测模型和决策模型。

机器学习有监督学习、无监督学习和强化学习等不同的学习方式,可以应用于各种不同的领域,如自然语言处理、计算机视觉、音频信号处理和金融等。

机器学习的数据来源可以是结构化数据和非结构化数据,如图像、文本、音频和视频等。

九、机器学习(machine learning)在心理学中有哪些应用?

机器学习包含很多种方法,但重要的还是其思想与目标。

机器学习的目标是预测,重要的思想是降低抽样误差。而这两样东西如果能恰当地运用在心理学研究中,将会使心理科学锦上添花。

心理学所面临的挑战

一篇发表在Perspectives on Psychological Science上的名为Choosing Prediction Over Explanation in Psychology: Lessons From Machine Learning的文章详细地阐述了为什么心理学需要机器学习。

Yarkoni, T., & Westfall, J. (2017). Choosing Prediction Over Explanation in Psychology: Lessons From Machine Learning. Perspectives on Psychological Science, 12(6), 1100-1122.

心理学的目标在于理解人类行为,这其中包括解释以及预测人的行为。然而这两个目标很少被区分对待。

The goal of scientific psychology is to understand human behavior. Historically this has meant being able both to explain behavior—that is, to accurately describe its causal underpinnings—and to predict behavior—that is, to accurately forecast behaviors that have not yet been observed. In practice, however, these two goals are rarely distinguished (Yarkoni & Westfall, 2017).

如果研究能更强调预测,而将解释作为次要目标,无论在短期或长期,都将是一个富有成效的办法。

Research programs that emphasize prediction, and that treat explanation as a secondary goal, would be more fruitful both in the short term and the long term.

导致心理学重“解释”,轻“预测”的一个很大的原因是:很少有心理学工作者了解与运用预测科学的工具

one of the biggest reasons that psychologists have historically opted for explanation is that, in the not-so-distant past, the tools of successful predictive science were poorly understood and rarely deployed in most fields of social and biomedical science.

如果解释性科学并不是预测性科学,或反过来说,预测性科学并不是解释性科学。那么,研究者必须做出一个选择:去解释亦或是去预测。大多数心理学都选择了“解释”,而没有给予“预测”更多、更严肃的考虑

If ideal explanatory science is not generally ideal predictive science, and vice versa, then researchers must make a conscious choice: to explain or to predict. Historically, most of psychology has reflexively chosen an explanatory approach, without giving any serious consideration to a predictive approach (Yarkoni & Westfall, 2017).

作者谈到了心理学中的“可重复性危机

There is mounting evidence from the ongoing replication crisis that the published results of many papers in psychology do not, in fact, hold up when the same experiments and analyses are independently conducted at a later date (Ebersole et al., 2015; Nosek & Lakens, 2014; Open Science Collaboration, 2015).

那么机器学习能给心理学带来什么?

机器学习领域奠基人之一、美国工程院院士T. Mitchell教授在其经典教材《Machine Learning》中所给出的机器学习经典定义为“利用经验来改善计算机系统自身的性能”。

机器学习与人工智能常常相提并论,它们之间是什么关系呢?

机器学习与人工智能

人工智能(Artifical Intelligence)是一个更上位的概念,偏应用领域。机器学习是实现人工智能的手段与方法,而深度学习(Deep Learning)又是机器学习领域中的一个方向。

机器学习的流程

机器学习的流程

与心理学不同,机器学习的流程是拿到数据后先将数据拆分为训练集(Training set)与测试集(Test set),然后用训练集训练模型,后建立模型,再用测试集测试模型,最后衡量模型优劣。

训练集不用做测试模型,测试集不用做训练模型。

用心理学的话说,这个流程是为了让模型的外部效度(External Validity)更高。因为拿建立模型的数据去测试模型的效果,结果肯定不会太差。这样得到的模型是否能够适应新数据、新环境?有待拿另一批没用过的数据来验证。

心理学除了编制问卷流程中涉及到探索性因子分析(EFA)与验证性因子分析(CFA)时,对数据做了拆分,其他情况下一般不拆分数据。(EFA+CFA的思想与机器学习的流程有异曲同工之妙)

数据集拆分

通常对数据集的拆分是二八开,即80%的数据用作训练集,剩下20%的数据用作测试集。但实际情况可以稍有区别,如75%-25%或90%-10%。

机器学习的方法:

  • 回归(Regression)
  • 支持向量机(Support Vector Machine)
  • 人工神经网络(Artificial Neural Network)
  • 关联规则学习(Association Rule Learning)
  • 决策树(Decision Tree)
  • 随机森林(Random Forest)
  • 朴素贝叶斯(Naive Bayes)
  • K最邻近(k-Nearest Neighbor)

机器学习的方法有很多,以上只是列举主流方法。其中回归并不是只有机器学习才有,它普遍存在于众多学科领域中。但机器学习较常用下面几种回归方法:

  1. 逻辑回归(Logistics Regression)
  2. 岭回归(Ridge Regression)
  3. LASSO (Least Absolute Shrinkage and Selection Operator)

回归在心理学中的运用(从机器学习的角度)

一篇发表在PNAS上名为Computer-based personality judgments are more accurate than those made by humans的文章探讨了机器评估人格是否比人类评估更精确,从标题的肯定句式就可以判断出该研究得出的结论是肯定的。

Youyou, W., Kosinski, M., & Stillwell, D. (2015). Computer-based personality judgments are more accurate than those made by humans. Proceedings of the National Academy of Sciences, 112, 1036-1040.

原文链接:https://www.pnas.org/content/112/4/1036

研究流程

上图是该研究的分析流程:

  1. 采用IPIP五因素模型人格量表测量70520位用户的人格,形成矩阵(行:用户,列:人格五维度)
  2. 收集这些用户在Facebook上喜欢的主题(点击Like),形成一个矩阵(行:用户,列:喜欢的主题)
  3. 利用流程1和2的数据来建模,形成一个回归模型(因变量:人格维度,自变量:喜欢主题)
  4. 利用建立好的回归模型来预测测试集(test set)中用户的人格
研究结果

X:Facebook喜欢的数量 Y:准确率(自我-他人一致性)

六条线不同颜色的线条分别代表人格五维度+五种特质的平均值(红色)

随着获得的LIKES数据的增加,预测的准确率逐渐攀升。开放性的准确率相对其它四种人格特质更高。研究采集了用户的同事、朋友、同居者、配偶和家庭成员对这些用户的人格评估。评估准确性由高到低依次为:

  1. 配偶(0.58)
  2. 家庭成员(0.50)
  3. 朋友(0.45)
  4. 同居者(0.45)
  5. 同事(0.27)

人类平均准确率为0.49,机器平均准确率为0.56。机器评估显著优于人类评估(z = 3.68, p < 0.001)。在获得用户300个LIKES主题后,机器预测准确率将超越所有人类(用户的同事、朋友、同居者、家庭成员与配偶)。

该研究来自剑桥大学心理系,该团队在2年后发表了另一篇文章Birds of a Feather Do Flock Together: Behavior-Based Personality-Assessment Method Reveals Personality Similarity Among Couples and Friends来探讨伴侣、朋友与自己的人格相似性。

Youyou, W., Stillwell, D., Schwartz, H. A., & Kosinski, M. (2017). Birds of a Feather Do Flock Together: Behavior-Based Personality-Assessment Method Reveals Personality Similarity Among Couples and Friends. Psychological Science, 28(3), 276–284.

原文链接:Birds of a Feather Do Flock Together: Behavior-Based Personality-Assessment Method Reveals Personality Similarity Among Couples and Friends - Wu Youyou, David Stillwell, H. Andrew Schwartz, Michal Kosinski, 2017

以往认为择偶或择友都是随机的,而且自我报告的人格测验都显示配偶或朋友与自己的人格相关度很低,但作者并不认同这一结论。认为这可能是由于群体参照效应(reference-group effect)导致的。

前人对此做出的改进:

Botwin et al. (1997) and Buss (1984a) measured personality using independent interviewers' ratings and found similarity among spouses. Admittedly, this type of measure is still subject to the reference-group effect because the interviewer has his or her own reference group, but it affects both dyad members equally and therefore does not obscure the similarity between them.

Introversion, for example, was assessed by asking participants to judge whether in the last 3 months they "watched the soap opera on TV" or "went for a long walk alone" (Buss, 1984b, p. 368).

尽管前人努力做了改进,但仍避免不了群组参照效应。本文采用的方法是收集Facebook用户的两类数据:

  1. 脸书喜欢(Facebook Likes)
  2. 语言使用(language use: Facebook status updates)

Extraverts, for example, tend to use more words describing positive emotions (e.g., "great," "happy," or "amazing"; H. A. Schwartz et al., 2013) than introverts do.

第一类数据在上一篇文章中有过介绍,语言使用则是采集用户发布状态所使用的语言。比如,相较于内向的人,外向者更经常使用great, happy或amazing这些词语。

主要流程:

  1. we obtained a sample of participants with both self-reports of personality and Facebook data.
  2. Next, we built a series of predictive models to link self-reports of personality with Likes or language use, respectively.
  3. The resulting models were then applied to a separate sample of romantic partners and friends to generate personality scores for these participants.

可以看出不管是用LIKES(左上角)还是用户发布状态所使用的语言(右上角)数据,得到的恋人与朋友的人格相似性均高于自我报告的人格相似性(右下角)。其中语言数据得到的相似性更高。

以上两篇文章所使用的回归方法并不稀奇,但拆分数据为训练集与预测集的思想在心理学研究中并不常见。

人工神经网络在心理学中的运用

人工神经网络(Artificial Neural Network, ANN)简称神经网络(Neural Network,NN)或类神经网络,在机器学习和认知科学领域,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。

real neuron

在真正的神经元中,树突(Dendrites)用于接收信号,轴突(Axon)用于传递信号。

在人工神经网络中,树突可以看作为输入,轴突看做输出,用来处理信息的细胞体可以看作为隐藏层(Hidden layer)。

Example of simple network

非常火的深度学习就是包含多个隐藏层的人工神经网络。

深度学习常常被运用在图像识别领域。比如识别一张图片是猫还是狗,输入层是猫狗图片,输出层就是判断图片是猫还是狗。

深度学习的流程:

使用带有猫的图片作为训练集(此处数据为图像数据)来建立神经网络模型(多个隐藏层),当有新图片进入时,便可以使用该模型来推断这张图片会否包含猫。

JCP上的一篇名为Neural network applications in consumer behavior的文章总结了ANN在消费心理学中的运用。

Briesch, R., & Rajagopal, P. (2010). Neural network applications in consumer behavior. Journal of Consumer Psychology, 20(3), 381-389.

作者整理了以往采用ANN来研究消费选择、消费行为、消费者满意度等的文献。

另一篇相对较新的发表在Journal of Research in Personality上的文献将ANN运用在人格的研究中。

Read, S. J. , Smith, B. , Droutman, V. , & Miller, L. C. . (2017). Virtual personalities: using computational modeling to understand within-person variability. Journal of Research in Personality, 69, 237.

该研究将情境因素看做输入层隐藏层分为趋近(Approach)与回避系统(Avoidance),输出层为人的行为。

在改进后的神经网络模型中,输入层包含身体状态(Bodily state)与情境因素,行为会给最初的输入层一个反馈,这个反馈又包含Satiation与Consummation。举个例子就容易理解了:

  • 身体状态:饥饿
  • 情境因素:桌上有美味的食物
  • 行为:吃

当我们的身体处于饥饿状态,而桌上恰巧有美味的食物时,我们倾向于将桌上的食物吃掉。当吃掉食物后,行为会给到输入层两个反馈。对于身体状态来说,饥饿状态没了,对于情境因素来说,桌上的食物被吃掉了。

决策树在心理学中的运用

决策树是一种有监督的机器学习算法,通常以一个倒立的树呈现。在树中,节点代表自变量,节点之间的连接代表决策,每一个叶节点代表一个结果(因变量)。

A Decision Tree is a Supervised Machine Learning algorithm which looks like an inverted tree, wherein each node represents a predictor variable (feature), the link between the nodes represents a Decision and each leaf node represents an outcome (response variable).

决策树的优势:

  1. It is considered to be the most understandable Machine Learning algorithm and it can be easily interpreted.
  2. It can be used for classification and regression problems.
  3. Unlike most Machine Learning algorithms, it works effectively with non-linear data.
  4. Constructing a Decision Tree is a very quick process since it uses only one feature per node to split the data.

理解决策树的一个非常好的例子:

http://www.r2d3.us/%E5%9C%96%E8%A7%A3%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92%E7%AC%AC%E4%B8%80%E7%AB%A0/

一篇发表在Child Indicators Research上的关于欺凌的文章探讨了哪些因素会使得青少年受到欺凌,使用的方法是分类与回归树

Moon, S. S., Kim, H., Seay, K., Small, E., & Kim, Y. K. (2015). Ecological Factors of Being Bullied Among Adolescents: a Classification and Regression Tree Approach. Child Indicators Research, 9(3), 743-756.

原文链接:https://link.springer.com/article/10.1007/s12187-015-9343-1

这种方法的一个非常大的优势是可以看出各个自变量之间的复杂交互关系。比如,在上图的结果中,根节点是年龄,这是对因变量欺凌行为(二分变量,是或否)的一个重要预测变量。14.5岁以上的青少年是否受到欺凌更易受到Enjoy classmates的影响。而影响14.5岁以下的青少年是否被欺凌的因素就多得多,如父母支持、学业压力等。

这样的发现是我们平常简单地收集一些自变量,然后使用线性回归得出的结论所不能达到的。因为那样只能得出年龄是一个影响因素,亦或是将年龄当做一个控制变量(尤其是在结构方程模型中)。即使采用多组SEM做群组分析,你也很难恰好将14岁拿出来做分组标准。

另一篇采用回归树的方法运用在组织行为学中的研究:

Giorgi, G., Dubin, D., & Perez, J. F. (2016). Perceived Organizational Support for Enhancing Welfare at Work: A Regression Tree Model. Frontiers in Psychology, 7(1770).

随机森林在心理学中的运用

随机森林是基于决策树的一种方法,一棵树得出的结论可能有偏,那多颗树的结论可能弥补这一缺陷。因此,建立一片森林能使得结果能可靠。

随机森林的建立流程

主要的思想是抽取数据集中不同的样本,然后取这些不同样本的子集,通过这些子集建立决策树,最后将所有的决策树的结果做平均。

一篇发表在Personality and Individual Differences上的文章采用随机森林的方法评估了正念冥想问卷的效度,可以说是随机森林在心理测量学中的运用

Sauer, S. , Lemke, J. , Zinn, W. , Buettner, R. , & Kohls, N. . (2015). Mindful in a random forest: assessing the validity of mindfulness items using random forests methods. Personality and Individual Differences, 81, 117-123.

以上是机器学习中一些主流方法在心理学中的运用。

模型评估

对模型优劣的评估主要涉及对分类模型回归模型的评估。

评估分类模型优劣主要采用:

  • 混淆矩阵(Confusion Matrix)
  • ROC (Receiver Operating Characteristic)
  • AUC(Area Under Curve)
Confusion Matrix

在混淆矩阵中,行代表实际值,列代表预测值

  • 实际值是阳性,预测值也是阳性,叫做真阳性(正确接受);
  • 实际值是阴性,预测值是阳性,叫做假阳性(错误接受);
  • 实际值是阳性,预测值是阴性,叫做假阴性(错误拒绝);
  • 实际值是阴性,预测值也是阴性,叫做真阴性(正确拒绝)。

这和普通心理学中信号检测论中的内容相似,也和一类、二类错误(Type I, Type II error)的内容有联系。

评估回归模型优劣主要采用Root Mean Squared Error (RMSE)

RMSE

这就是回归方程中的误差项,不再赘述。

取样误差带来的挑战

取样会影响模型的表现(Sampling can affect performance measures)。

因此,需要更为稳健的测量方式如交叉验证(Add robustness to these measures: cross-validation)。

交叉验证的思想是:sample multiple times, with different separations

交叉验证的主要形式

  1. K-fold cross-validation
  2. Leave-One-Out-Cross-Validation (LOOCV)

第二种留一交叉验证由于耗时,其优势不如第一种K折交叉验证明显。

4-fold cross-valudation

K折交叉验证就是将收集到的数据平等地划分为K份,这样产生了K个训练集以及K个测试集。平均K次的结果或者使用其它结合方式,最终得到一个单一估测。这个方法的优势在于,同时重复运用随机产生的子样本进行训练和验证,每次的结果验证一次,10折交叉验证是最常用的。

机器学习与心理学的相关性

机器学习的一些思想并不是这个学科所独有的,心理学有一些概念或方法所使用的的理念与其有相似之处。总结为以下几点:

  1. 特征(feature) vs 自变量,目标(target) vs 因变量
  2. 训练集与测试集 vs 探索性因子分析与验证性因子分析
  3. Bootstrap vs k-fold cross-validation

第一,机器学习通常把自变量叫做特征,因变量叫做目标。其实就是自变量与因变量。

第二,机器学习对于数据集的拆分与心理测量学中问卷编制阶段的因子分析类似,都是出于担心旧样本生成的模型不能很好地适应新数据。探索出量表的结构后,需要在一个新的数据集上对已经得到的结构进行验证。

第三,虽然Bootstrap不是因为心理学发明的,但它已经是中介效应的主流检验方法,其背后的思想是重复抽样(如,有放回的抽样5000次,最后平均)。这与K折验证背后拆分K次的思想类似(运用随机产生的子样本训练与验证,最后合成)。

为什么心理学需要机器学习?

  1. 机器学习中预测的思想弥补心理学中重解释、轻预测的现状;
  2. K-fold cross-validation用于得到可靠的模型;
  3. 机器学习的一些方法如人工神经网络能建立具备非线性关系、复杂关系的心理模型;
  4. 机器学习中的模式分析可为理解人类行为背后隐藏的深层模式带来帮助。

最后,任何一样东西都不是你想得那样难,也不是你想的那样简单。我们应当对学习机器学习的概念与方法要抱有信心。

PS:AI界的一些大牛如Hinton,Jordan具备心理学背景。

神经网络之父、深度学习鼻祖 Geoffrey E. Hinton

Geoffrey E. Hinton

Hinton曾在剑桥大学攻读实验心理学,后再爱丁堡大学攻读人工智能。

资料来源:http://www.cs.toronto.edu/~hinton/

AI界泰斗,美国科学院、美国工程院、美国艺术与科学院三院院士Michael I. Jordan

Michael I. Jordan
Michael I. Jordan is the Pehong Chen Distinguished Professor in the Department of Electrical Engineering and Computer Science and the Department of Statistics at the University of California, Berkeley. He received his Masters in Mathematics from Arizona State University, and earned his PhD in Cognitive Science in 1985 from the University of California, San Diego.

Jordan本科专业是心理学,博士专业是认知科学

资料来源:https://people.eecs.berkeley.edu/~jordan/

参考文献:

Briesch, R., & Rajagopal, P. (2010). Neural network applications in consumer behavior. Journal of Consumer Psychology, 20(3), 381-389. Giorgi, G., Dubin, D., & Perez, J. F. (2016). Perceived Organizational Support for Enhancing Welfare at Work: A Regression Tree Model. Frontiers in Psychology, 7(1770). Moon, S. S., Kim, H., Seay, K., Small, E., & Kim, Y. K. (2015). Ecological Factors of Being Bullied Among Adolescents: a Classification and Regression Tree Approach. Child Indicators Research, 9(3), 743-756.Read, S. J. , Smith, B. , Droutman, V. , & Miller, L. C. . (2017). Virtual personalities: using computational modeling to understand within-person variability. Journal of Research in Personality, 69, 237.Sauer, S. , Lemke, J. , Zinn, W. , Buettner, R. , & Kohls, N. . (2015). Mindful in a random forest: assessing the validity of mindfulness items using random forests methods. Personality and Individual Differences, 81, 117-123.Yarkoni, T., & Westfall, J. (2017). Choosing Prediction Over Explanation in Psychology: Lessons From Machine Learning. Perspectives on Psychological Science, 12(6), 1100-1122.Youyou, W., Kosinski, M., & Stillwell, D. (2015). Computer-based personality judgments are more accurate than those made by humans. Proceedings of the National Academy of Sciences, 112, 1036-1040. Youyou, W., Stillwell, D., Schwartz, H. A., & Kosinski, M. (2017). Birds of a Feather Do Flock Together: Behavior-Based Personality-Assessment Method Reveals Personality Similarity Among Couples and Friends. Psychological Science, 28(3), 276–284.

十、简述机器学习过程与应用

简述机器学习过程与应用

机器学习是人工智能的一个分支领域,通过训练模型实现对数据的分析和预测。在当今社会,机器学习被广泛应用于各个领域,如医疗保健、金融、农业和自然语言处理等。

机器学习的基本过程

机器学习的基本过程可以分为数据采集、数据预处理、模型选择与训练、模型评估与调优以及模型应用这几个步骤。

数据采集

在机器学习过程中,首先需要收集与问题相关的数据,这些数据将作为模型训练的基础。数据可以来自各种来源,包括传感器、数据库、文本等。

数据预处理

数据预处理是机器学习中至关重要的一步,通过数据清洗、特征选择、特征转换等方式,使数据能够被模型准确地学习和预测。

模型选择与训练

在选择模型时,需要考虑问题的类型和数据的特性,常用的模型包括决策树、支持向量机、神经网络等。之后,利用训练数据对模型进行训练,使其学习数据的模式和规律。

模型评估与调优

模型训练完成后,需要对其进行评估,常用的评估指标包括准确率、精确率、召回率等。根据评估结果,进一步优化模型的参数和结构,提高模型的预测性能。

模型应用

最后一步是将训练好的模型应用于实际问题中,根据输入数据进行预测和决策,实现对未知数据的预测和分类。

机器学习的应用

机器学习在各行各业都有着广泛的应用,以下是几个典型的应用场景:

  • 医疗保健领域:机器学习可以帮助医生诊断疾病、预测患者的风险等,提高医疗服务的效率和质量。
  • 金融领域:通过机器学习技术,可以实现风险管理、信用评分、欺诈检测等金融服务。
  • 农业领域:利用机器学习分析土壤、气候等数据,帮助农民做出种植决策,提高农业生产效率。
  • 自然语言处理:机器学习在语音识别、机器翻译、情感分析等方面有着广泛的应用,帮助机器理解和生成自然语言。

总的来说,机器学习在不断地发展和演进,为各行各业带来了巨大的变革和机遇。通过不断地学习和实践,机器学习的应用领域将会更加广阔,为人类社会的进步做出更大的贡献。

为您推荐

返回顶部