中药大数据的文本挖掘与方剂病症预测
摘要:摘要摘随着信息技术的发展与国家社会对中医药信息化建设的重视,对中医药数据挖掘的工作也随之深入。由于历史与地域的原因,中医药信息量巨大。如何充分利用文献典籍、方剂来完成数据挖掘工作,从中找到有用的中医药知识为中医药配伍提供辅助决策。数据挖掘可以用于找出隐藏于大数据之下的规律。中医药语料库建设、适合中医药领域的自然语言处理技术、以及文本数据挖掘技术逐渐成为中医药现代化的一大重点。
关键词:中医药;语料库; 语义分析;数据挖掘
一、文献综述
本文主要从中医药数据的知识库建设、自然语言处理在中医药数据挖掘的运用、数据建模预测三大方面对国内外近几年的发展研究进行综述。
(一)中医药数据的知识库及语料库建设
中医药数据的数据采集和语料库建设是中医药数据挖掘的基础,白玲玲等人总结的中医药文献的特点及如何构建中医药知识库由于中医药古文献的特点:实用价值的无限性;数量庞大,著录分散;书名繁杂多样,不能确切反映书的内容;语言不规范,字词含义古今有别;分类独特,不利于检索。建立一个完整全面的中医药数据库可以对研究工作提供大量的数据基础,从而使中医药古文献所蕴涵的信息价值得到充分地开发和利用。
中医药语言知识库建设的基础是中医药语言知识库(如机器词典、语料库、句法规则库等)可以实现计算机对中医药古文献文本内容的理解,从而为实现知识发现、人工智能、机器翻译、语义检索等提供数据基础,而中医药语料库的构建是基础中的基础。在中医药古文献语料库的基础上,可以实现中医药语言知识库的建立,同时也可以进行大量的研究工作,如:输出任何主题的中医词典;为实现中医药语义检索、建立中医本体、非相关文献知识发现等研究工作提供数据基础。
(二)数据挖掘方法
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。