专利名称:一种中文文档集的主题可视化方法专利类型:发明专利
发明人:朱敏,梁婷,甘启宏,李明召,李一申请号:CN201310488312.7申请日:20131017公开号:CN103631856A公开日:20140312
摘要:本发明公开了一种中文文档集的主题可视化方法,包括按主题对文档集分类的步骤,划分文档集时间段的步骤,计算主题频次的步骤,对主题进行排序的步骤,生成主题流图的步骤,提取表示主题内容的关键词的步骤,计算关键词的权重并排序的步骤和生成文字云的步骤。还包括基于主题频次和几何互补性的排序方法、文字云布局方法以及生成详细的文字云方法。本发明的技术效果在于:1、实现了对中文文档集的主题可视化。2、采用基于主题频次和几何互补性的排序方法生成的主题流图更美观、更平坦,空间利用率高,更利于文字云的放置。3、文字云布局方法能有效利用空间,大大提高了布局效率。4、生成详细的文字云可以展示主题的所有关键词内容。
申请人:四川大学
地址:610065 四川省成都市武侯区一环路南一段24号
国籍:CN
代理机构:成都信博专利代理有限责任公司
代理人:卓仲阳
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容