基于文本分析的人格检测研究与实现文献综述

 2022-09-22 11:29:18

  1. 文献综述(或调研报告):

一、人格特征的定义

人类生活中重要的方面会被赋予描述的词汇,不仅如此,如果某个事物真的重要而且普遍存在,在所有的语言中它都会被赋予更多的词汇来描述。于是,从词汇中去发现人格特质成为了人格研究的重要途径。奥尔波特率先开始了这项艰苦卓绝的工作,他让助手精确地数出了在英语辞典中有多少个描述人格差异的词汇,结果是17953个。之后他又从中挑选出4500个,但这显然还是太多。后来卡特尔从这4500个词中选出了他认为特别重要的35个词,并对他们进行了因素分析。1949年,菲斯克从卡特尔的词汇表中选出了22个用于分析,他对比了在这些特质上自我评定和同伴评定、心理咨询师的评定之间的关系。他的分析发现有五个因素总是最先出现在列表上,这就是后来的大五人格因素。十几年后,由两位心理学家组成的研究小组检验了包括大学生和空军职员在内的8个样本的数据,也发现了同样的5个因素。随后多年,在更大范围样本研究中,大五人格因素一直被不断地重复发现,直至成为一个西方心理学界公认的人格特质模型了解个人的人格特征。这个模型是基于词与人格之间的关联并定义了五个概括性因素:开放性,责任心,外向性,宜人性和神经质。

想要了解个人的人格特征,可以通过不同的文本预测用户的兴趣和偏好。这可以用来改善广告,针对政治活动,识别恶意行为,优化产品和页面推荐。

二、文本分析思路

文本分析的定义:

文本分析是指对文本的表示及其特征项的选取;文本分析是文本挖掘、信息检索的一个基本问题,它把从文本中抽取出的特征词进行量化来表示文本信息。文本(text),与讯息(message)的意义大致相同,指的是由一定的符号或符码组成的信息结构体,这种结构体可采用不同的表现形态,如语言的、文字的、影像的等。文本是由特定的人制作的,文本的语义不可避免地会反映人的特定立场、观点、价值和利益。因此,由文本内容分析,可以推断文本提供者的意图和目的。

文本分析特征提取方法思路,常见的有4种:

(1)用映射或变换的方法把原始特征变换为较少的新特征。

(2)从原始特征中挑选出一些最具代表性的特征。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。