互联网信息监测与决策分析平台


由于互联网产生的信息泛滥,研究人员很难快速评估一个事件的真实情况。本次项目即为了解决以上问题,为科研人员提供一个智库平台。

项目概况

怎样从海量的科技信息及其相关信息中扫描、识别、监测和追踪科技主题的发展变化,怎样高效获取和有效组织这些信息,并从中发现科学技术的体系结构、领域之间的关系及其变化,是本项目的切入点,因此,构建科技发展前沿互联网信息监测与分析平台势在必行。

项目客户对象: 政府管理与决策者 、科研机构 、科研人员、智库平台等。

项目功能

监测与分析平台由网站信息抓取、文件管理 、本体管理、信息检索、信息分析和用户管理6部分组成。本项目建成后,将能够为研究人员获取和分析研究资料提供高效的工具,并逐步形成相关研究领域的知识库、资料库。本项目建成后,在研究过程的每一个环节上,都能提供有效的优化工具,如下所示:
(一)扩大信息获取的覆盖面;
(二)海量信息的自动分类和关键元素提取;
(三)更精确地定位和查阅有效信息。


在课题研究阶段,本项目实现多维分析、倾向性分析、热点分析、趋势分析等功能,能够有效辅助研究人员从大量的信息和文献中进行分析,提炼出有助于研究工作的素材。
在形成研究成果阶段,信息系统能够根据预置模板,生成相关分析报表、分析报告和原始资料,并支持导出成为Word等格式,更便于研究人员编制研究成果。
信息获取的方式监测与分析平台提供了网站信息自动抓取和用户收集信息上传这两种信息获取的方式。网站信息自动抓取,主要抓取公开发布于互联网的信息。为使信息能最大程度的自动化处理,需要构建网站解析库,保存网站中不同网页的信息,监测与分析平台据此批量下载所选网站中需要下载的内容。

信息采集源

政府和机构网站

主要指国际、国内主要相关政府部门和国际组织的官方网站,国际知名智库、大学和研究机构的网站,这些网站是有关国际问题的权威信息发布途径。

学术期刊网站

包括境内外国际问题研究领域、具有较高影响力的各学术期刊网站,主要获取最新研究主题和研究动向,了解最新学术发展情况。

新闻媒体网站

新闻媒体网站主要包括国际、国内主流新闻媒体网站,是获取最新国际重大事件、相关事态发展最新情况的有效途径。
除了上述网站,本项目还需要进一步采集相关领域专业数据库,并实现和本市宣传部门的数据共享。

相关领域数据库

实现各主要大国、地区大国、以联合国为首的重要国际组织、以二十国集团和金砖国家等为代表的重要多边机制官方发布报告库(中英法三语种)的信息采集抓取,整合上海外国语大学学术论文数据库、中国知网、中国统计年鉴、海关统计年鉴、中国工业经济统计年鉴、中国工业企业数据库、中经网统计数据库等专业数据库的部分查询功能。

省市区开放共享数据

据初步了解,各省市区部门正在建设互联网内容安全监管和文化建设共享平台(简称“共享平台”),该平台主要采集国内有关的中文舆情信息,并可提供共享。

功能分析

  • 对文本中的关键统计数据进行专门的提取(如国防预算、GDP增速等)
  • 对文本内容进行自动的概括和总结,形成诸如自动摘要的服务。 
  • 对文本内容的关键元素进行提取,如人物、机构、地点、时间、事件、信源等。
  • 对数据库的文本类型进行分类,如新闻报道、新闻分析和社论、政府文件、期刊论文、研究报告、公报声明、领袖讲话以及民调数据等。
  • 对文本的倾向性态度进行初步分析,从而帮助研究人员撰写定期或不定期的国际舆情报告。
  • 对文本中的事件、人物、机构、地点等要素进行热点和趋势分析。

海量非结构化文本信息经过处理后,形成了结构化或半结构化的数据,需要进行多维度的分析工作。系统应能够提供各类基础分析模型和自定义分析工具,主要分析模型包括:

  • 时间检索多维分析模型
  • 地点检索多维分析模型
  • 人物检索多维分析模型
  • 机构检索多维分析模型
  • 事件检索多维分析模型
  • 书籍检索多维分析模型
  • 论文检索多维分析模型

总结

监测与分析平台通过高效获取不同来源、不同格式的信息,运用本体技术对这些信息进行有效的组织,展现这些信息反映的科技领域知识概念的结构及其变化,同时运用文本聚类技术,深入挖掘科技主题及其相互关系,结合国家、时间等维度的变化,为分析科技发展的宏观走势,以及对科技、经济和社会产生影响的科技发展前沿趋势提供支撑。

 

相关阅读:更多案例!

最全的中国开放数据(Open Data)及政府数据开放平台汇总

【Open Data】国外开放数据中心及政府数据开放平台汇总

全国大数据交易所及数据交易平台汇总

蜀ICP备15035023号-4