面向海量高维数据的文本主题发现

来源 :情报杂志 | 被引量 : 0次 | 上传用户:shirleyzuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对潜在语义分析(LSA:Latent Semantic Analysis)方法在海量高维数据中的制约,提出K均值聚类的LSA方法(KLSA):通过利用K均值聚类对主题词进行预处理,将主题词降到相对低维空间后再使用LSA方法;选取新浪微博文本数据作为具体研究对象,通过实验证明了所提出的方法能够在确保模型分类效果条件下,很好地满足海量高维数据对LSA方法计算速度的敏感要求。
其他文献
水中捆绑尸体的情况错踪复杂,笔者对18例捆绑的水中尸体进行分析。一、死者情况1. 捆绑后投水自杀共9例,均为男性,农民,溺水致死,有典型的溺死特征;衣着整齐,生前均健康,并有
期刊
在分析国内废旧塑料回收现状以及传统塑料回收工艺的基础上,遵循机械设计原理,设计出热风循环熔融废旧塑料回收造粒机,将废旧塑料经热风加热熔融后,再由单螺杆将熔融塑料挤出
本文回顾了民族符号学的发展历程,从理论准备、正式形成和全面发展时期对其发展进行了评述,概括了民族符号学作为一门学科在多学科的理论研究铺垫之下产生和展开的过程,展示
采用铬铁矿覆膜砂生产热芯和调整碳当量及残留镁含量两种措施,铸件的缩松缺陷明显减轻,并且缩松位置集中在铸件心部,达到改善缩松缺陷的目的。
<正>龙湖滟澜山、龙湖香醍漫步、龙湖花盛香醍……一个个令人耳目一新的项目出现在市场上,依靠极富冲击力的的产品品质和对细节的关注,给北京的房地产市场注入一股清新的气息
巫术是原始宗教的重要组成部分,原始先民为了生存,便凭借着对大自然的一些神秘与虚幻的认识,创造了各种法术,以期望能够寄托和实现某些愿望。原始巫术的内涵十分驳杂,大都表
<正>小数乘除法简算方法很多,概括起来主要有以下几种类型:一、运用乘法运算定律1.运用乘法交换律例1.2.5×4.28×0.4[分析与解]交换因数4.28与0.4的位置,先计算2.5×.4,可使
在沿江砂壤土上进行了长达12年的稻麦复种连作少、免耕定位试验。结果表明,少耕的稻、麦产量与常耕基本持平,免耕小麦稳定增产,平均增产5.3%,免耕水稻平均减产2.2%,长期少、免耕产量没有明显
<正> 白芨,一作白及,又名双肾草、西牛角、呼良姜、凉姜、紫兰,中药又叫甘根和白根。它属于大名鼎鼎的兰科“家族”,是陆生兰的一种。 白芨是多年生草本花卉,地下有块根状、
<正>萎缩性胃炎,一种严重侵害人类健康的疾病,老年人亦有染患。为了帮助读者有效地防治此病,记者日前专程赴京,采访了我国著名消化病专家杨晋翔教授,请他谈了防治的相关知识