通过自聚类的软件说明文档来挖掘标注SAAS服务的标签

来源 :2012年第三届中国计算机学会服务计算学术会议 | 被引量 : 0次 | 上传用户:cox_7261
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  基于SAAS的在线服务数量曰益宠大,使得如何有效的查找特定的服务成为突出问题。目前普遍采用用户自定义的服务标签来标识服务,并通过标签来搜索服务,但这些标签存在随意性,容易产生歧义。有鉴于此,本文提出一种从软件说明文档中挖掘用以标注服务的标签的方法,为了验证该方法,本文收集了多特软件平台上的软件说明文档,通过文本挖掘技术从中提取特征词汇,并对特征词汇进行相似度计算,利用特征词汇的相似度来计算软件说明文档之间的相似度,并以此来构建软件网络,其中节点为软件,边为软件间的相似关系,边上权值为相关说明文档之间的相似程度,再通过复杂网络社区发现算法对软件网络进行自动聚类,最后将聚类后的软件的说明文档中的常用特征词汇进行统计,将之定义为该类别服务的推荐标签。
其他文献
三维传感器技术的不断发展使得机器人可以快速地获取场景深度信息,同步摄像头获取的颜色信息可以方便地获取三维场景信息。这不仅增强了机器人对室内场景的学习能力,而且提升了机器人在室内环境下的自主定位能力。但是,相比二维激光扫描,三维点云数据增加了机器人的处理负载。同时,由于同步带来的误差,使得点云信息噪音很大,增大了机器人对环境的理解难度。为此,本文提出了一种基于原始噪音点云的平面提取方法,是室内机器人
人手跟踪是基于视觉的自然人机交互领域中的一项重要研究内容。在单目摄像机和复杂背景条件下,本文提出一种基于PSO 的实时人手跟踪方法。该方法采用二维人手模型替代高维度的三维人手模型,将人手跟踪问题转化为优化搜索问题,通过最小化假设人手参数与真实观测值之间的差异来寻找最优的假设人手作为输出,并采用变种PSO 方法进行优化求解,人手参数空间即构成优化搜索空间。实验结果表明,该方法可以有效地实现动态和复杂
通过研究知网语义网络和中文FAQ 问答系统特点,提出了一种新的问句相似度计算方法——基于形式概念分析的方法,该方法在进行问句匹配过程中,不但考虑概念与概念之间相似度,同时兼顾概念的层次关系。试验结果证明,该方法在避免传统语义相似度计算方法义原错位现象的同时,充分体现概念深度对关键词语义相似度的影响,提高问句匹配的准确率。
如何将一个视频的内容以简洁直观、符合人眼视觉观察特性,并以视频缩略图的方式呈现给用户,直接决定了其在搜索浏览感兴趣视频时的用户体验。本文针对这一问题,一方面在图像显著性分析的基础上提出了一种新的图像内容易获取性特征,并利用支持向量回归的方法训练出一个图像内容易获取性评价模型。另一方面,为了保证所推荐视频缩略图的内容具有代表性,本文还采用了一种基于互增强的代表性排序方法。最后通过线性加权将视频关键帧
提出一种确定粒子滤波器中采样粒子数目的方法,旨在用最少、最有效的粒子近似人手高维状态的后验概率分布。首先,研究特定交互操作下第k 时刻手势的估计跟踪精度与第k+1时刻采样粒子分布的关联,在此基础上提出动态优化粒子数模型;然后根据当前时刻手势的跟踪精度,利用模型动态确定下一时刻的有效粒子数目。最后,根据改进的粒子优化方法,对粒子进行二次筛选,对权值很大和很小的粒子区别对待,使粒子的贡献达到最优。本文
在教育部信息安全类专业教学指导委员会“信息安全教学创新与实践研究”课题支持下,我们面向信息安全专业人才培养目标,围绕提升学员解决信息安全实际问题和创新能力展开了丰富的实践。从信息安全人才专业能力的准确定位出发,以全国大学生信息安全竞赛为引领,建立“大跨度”、“三维度”、“四位一体”的能力培养模式,将能力培养贯穿于课程实验、实习、课外实践和毕业设计等环节。按竞赛模式全方位培养学员的从一个创意开始,到
针对计算机网络课程教学中出现的学生主动探索能力和工程能力不足问题,基于卓越工程师培养要求和CDIO教育理念,在理论教学过程中融入工程实践能力的培养。首先提出计算机专业卓越计划的能力体系,由一般能力和专业能力构成。进而映射到计算机网络课程。重点从计算机网络专题调研和局域网络设计项目两方面,设计了详细的CDIO工作流程和应用方法,并给出了设计成果。实践证明,这些方法能很好地调动学生学习的主动性。
在动态、异构和自治的互联网环境中,对WEB服务组合的形式化分析与验证是保证面向服务计算软件应用实时可性的有效途径,寻找有效的形式化分析的方法和工具是热点领域。现有研究主要是集中在服务组合流程和静态结构方面,在动态反映用户需求的服务组合及服务的动态耦合支持不够。本文从服务本体语义的层次,通过对OWL-S进行RGPS属性扩充,然后将其应用SOA架构模型映射到PI演算模型,对服务组合的动态耦合和可靠性进
数据服务为跨域数据集成提供了虚拟数据层,并且通过组合方式支持用户定义嵌套关系的视图。然而,当底层的数据服务输出的关系中的元组发生更新时,该更新需要自下而上经过多个中间结果传播到顶层的嵌套关系的视图,一类挑战性问题是,如何减少更新传播过程中的冗余计算,提高视图的数据新鲜度。为此本文提出了基于数据服务的嵌套关系视图的增量更新方法。该方法利用面向对象的技术为视图中的元组建立嵌套任意层次的数据服务的引用,
当前众多物联网环境下的数据处理表现为连续实时的数据流查询。针对时间滑动窗口的数据流极值聚集查询,传统方法为获得连续的精确解,在高速高并发等极端的情形下需要维护大量的极值候选值,导致较大的内存开销。本文设计实现了内存有界的摘要数据结构及其聚集算法,维护时间窗口内有限数量的极值候选,连续返回查询的近似解;并从理论上证明了算法的有效性和与精确解的近似程度。在人工和真实数据集上的仿真实验表明,算法体现了计