由于互联网产生的信息泛滥,研究人员很难快速评估一个事件的真实情况。本次项目即为了解决以上问题,为科研人员提供一个智库平台。
怎样从海量的科技信息及其相关信息中扫描、识别、监测和追踪科技主题的发展变化,怎样高效获取和有效组织这些信息,并从中发现科学技术的体系结构、领域之间的关系及其变化,是本项目的切入点,因此,构建科技发展前沿互联网信息监测与分析平台势在必行。
项目客户对象: 政府管理与决策者 、科研机构 、科研人员、智库平台等。
监测与分析平台由网站信息抓取、文件管理 、本体管理、信息检索、信息分析和用户管理6部分组成。本项目建成后,将能够为研究人员获取和分析研究资料提供高效的工具,并逐步形成相关研究领域的知识库、资料库。本项目建成后,在研究过程的每一个环节上,都能提供有效的优化工具,如下所示:
(一)扩大信息获取的覆盖面;
(二)海量信息的自动分类和关键元素提取;
(三)更精确地定位和查阅有效信息。
在课题研究阶段,本项目实现多维分析、倾向性分析、热点分析、趋势分析等功能,能够有效辅助研究人员从大量的信息和文献中进行分析,提炼出有助于研究工作的素材。
在形成研究成果阶段,信息系统能够根据预置模板,生成相关分析报表、分析报告和原始资料,并支持导出成为Word等格式,更便于研究人员编制研究成果。
信息获取的方式监测与分析平台提供了网站信息自动抓取和用户收集信息上传这两种信息获取的方式。网站信息自动抓取,主要抓取公开发布于互联网的信息。为使信息能最大程度的自动化处理,需要构建网站解析库,保存网站中不同网页的信息,监测与分析平台据此批量下载所选网站中需要下载的内容。
政府和机构网站
主要指国际、国内主要相关政府部门和国际组织的官方网站,国际知名智库、大学和研究机构的网站,这些网站是有关国际问题的权威信息发布途径。
学术期刊网站
包括境内外国际问题研究领域、具有较高影响力的各学术期刊网站,主要获取最新研究主题和研究动向,了解最新学术发展情况。
新闻媒体网站
新闻媒体网站主要包括国际、国内主流新闻媒体网站,是获取最新国际重大事件、相关事态发展最新情况的有效途径。
除了上述网站,本项目还需要进一步采集相关领域专业数据库,并实现和本市宣传部门的数据共享。
相关领域数据库
实现各主要大国、地区大国、以联合国为首的重要国际组织、以二十国集团和金砖国家等为代表的重要多边机制官方发布报告库(中英法三语种)的信息采集抓取,整合上海外国语大学学术论文数据库、中国知网、中国统计年鉴、海关统计年鉴、中国工业经济统计年鉴、中国工业企业数据库、中经网统计数据库等专业数据库的部分查询功能。
据初步了解,各省市区部门正在建设互联网内容安全监管和文化建设共享平台(简称“共享平台”),该平台主要采集国内有关的中文舆情信息,并可提供共享。
海量非结构化文本信息经过处理后,形成了结构化或半结构化的数据,需要进行多维度的分析工作。系统应能够提供各类基础分析模型和自定义分析工具,主要分析模型包括:
监测与分析平台通过高效获取不同来源、不同格式的信息,运用本体技术对这些信息进行有效的组织,展现这些信息反映的科技领域知识概念的结构及其变化,同时运用文本聚类技术,深入挖掘科技主题及其相互关系,结合国家、时间等维度的变化,为分析科技发展的宏观走势,以及对科技、经济和社会产生影响的科技发展前沿趋势提供支撑。
相关阅读:更多案例!
最全的中国开放数据(Open Data)及政府数据开放平台汇总