数塔.Datale企业大数据平台介绍.数塔.Datale是一个基于探码科技Datale大数据采集、机器学习、模型算法、知识图谱、时序分析等人工智能技术的企业大数据工具平台。

数塔.Datale企业大数据平台介绍


数塔.Datale是一个基于探码科技Datale大数据采集、机器学习、模型算法、知识图谱、时序分析等人工智能技术的企业大数据工具平台。

平台介绍

数塔.Datale是一个基于探码科技Datale大数据采集、机器学习、模型算法、知识图谱、时序分析等人工智能技术的企业大数据工具平台。致力于为政府、金融机构、中小企业提供各种专业的大数据智能服务。从企业查询、获客、成长性评价、授信分析、舆情预警等业务场景出发,帮助政府机构大幅提升信息管理水平。

数塔.Datale应用“大数据+人工智能”技术挖掘数据价值。截止目前,打造了服务金融机构的大数据智能风控平台,服务政府部门的大数据智能风险监管平台,服务中小企业的大数据营销获客平台,服务“一带一路”沿线国家的企业大数据服务平台。

 

探码科技实现了一系列的大数据底层技术突破,开创性的应用机器学习等人工智能技术、评估企业成长价值和投资价值、预测企业全生命周期经营状况,帮助全国20多家园区机构有效实施金融创新,也帮助多地政府监管部门防范金融风险。

 

利用分布式高性能网络爬虫实时采集非结构化大数据、清洗降噪并转换为规范的结构化数据,利用卷积神经网络、LDA 聚类、支持向量机等机器学习算法,从多源异构数据中提取高相关性风险因子,构建一个覆盖全面、权重合理、可量化的行业特征风险模型:对非法集资风险趋势进行模拟、对企业 DNA 进行全面刻画、精准定位企业非法集资风险点。

核心功能

企业信息查询工具

基于全国3000万+收录企业大数据。一键查尽企业基础信息,包含工商、股东成员、知识产权、财税、新闻、团队招聘等。

企业API开放平台是一个面向企业及应用开发者的数据集成和分析服务平台。汇聚了3000万+企业大数据,涵盖150+数据维度,在提供基础数据接口服务的同时,还对外输出数据处理、智能模型配置等数据分析能力,帮助用户更加高效地挖掘数据价值,开发数据产品。

 

集合数据采集、数据挖掘、数据清洗、数据标准顶层设计和数据建模等大数据全产业链人才队伍,为您提供专业的技术支持和稳定的接口服务

企业舆情监控系统

企业舆情监测是指整合企业互联网信息采集技术及信息智能处理技术,通过对互联网海量信息自动抓取、自动分类聚类、主题检测、专题聚焦,实现用户的网络舆情监测和新闻专题追踪等信息需求,形成简报、报告、图表等分析结果,为客户全面掌握群众思想动态,做出正确舆论引导,提供分析依据。

建立基于SaaS模式的舆情语义分析基础设施,可更好的实现人机结合,提高舆情研判的准确率。企业舆情监测系统的具体功能:完成全网和指定网站互联网信息监测,实时监测各网站的相关内容的舆论导向是否正确及时发现负面、最新、最热、最重要的网络信息对已经发生的舆情和事件,掌握其在互联网上的传播特点和发展趋势通过植入行业舆情知识,建立适合于本企业舆情管理特色的舆情分析研判模型对重点事件、敏感事件的舆情进行回溯寻找舆情源头;跟踪舆情传播过程,进行传播趋势分析和统计;并全面监控舆情分布情况及处置结果。

企业风险评价系统

企业评估可以从多个维度考虑,一方面是经验风险预警预测评估;一方面是企业成长性、投资价值评估。当然如果数据更详细,还可以实现企业估值等模型。Datale评价模型共分20个风险等级。与外部评级相比,分层更明确,帮助投资机构进一步区分不同信用主体的风险情况。

 

政府决策支撑平台

基于数塔.Datale丰富的数据资源与数据挖掘能力,面向政府、高校、研究机构对于大数据及其衍生产品的实际需求,整合政府数据资源和企业大数据,形成全面覆盖宏观、微观,省、市、县、园区,标准行业和新兴产业全产业链的大数据服务产品,为政府提供决策支撑,为高校、研究机构提供数据素材,助力社会诚信体系建设。

 

政府诚信平台从宏观、中观、微观的角度出发,搭建数据库模块和应用主题模块,其中,数据库模块由宏观环境库、产业运行库、企业全景库三个子库构成,应用主题模块由营商环境、产业监测、产业聚集、产业评价、产业链、产业信用、企业画像、 智能报告八大模块构成,力图全方位、多角度构建地区、行业、企业社会诚信档案。

 

宏观环境库:

源于国家统计局等权威机构 以月、季、年为更新频率,包括GDP核算、人口、财政等主要宏观环境指标。

 

企业全景库:

整合工商、税务、海关、互联网等数据资源,以不定期抓取、月、年为更新频率,包括企业信用状况、财务状况等企业数据信息。

核心技术

技术体系

通过分布式数据采集技术、ETL(extract-transform-load)技术实现对结构化和非结构化数据的采集、清洗、转换和加载,按照内存分布式的数据存储方式进行安全存储,运用风险传导模型、复杂网络模型、行为统计模型、异常检测模型对数据进行量化处理,并通过交叉验证确保数据准确,让数据中隐藏的实用信息能够直观展示在用户面前。

 

技术理念

基于人工智能和机器学习算法,充分整合海量数据,同时通过深度挖掘投资、上下游、合作等关联关系,全面便捷的管理和呈现目标企业及其关联企业风险信息,集成了全网定向监控系统及大数据分析工具,实时采集推送企业客户的行为变化、舆情信息,并利用文本分析、机器学习、序列分析等工具,建立风险模型,实现动态预警,从而控制敞口风险,稳定资产质量,增强金融机构的风险管理水平。

 

数据采集

通过部署分布式爬虫引擎、对接权威官方数据,实现海量数据采集,使用ETL技术,将海量数据清洗、转载、加载后,采用数据加密存储、多副本存储的方式予以安全保存。

 

机器学习

独立研发MaaS系统(Machine learning as a Service),用户在提交结构化数据之后,系统自动实现模型建立的剩余过程。通过决策引擎帮助用户优化内部控制,并随着使用的加深,将用户经验工具化。

 

深度分析

独立研发“六菱星”模型,根据六度分析、复杂网络等理论基础,构建全方位立体网络关联图,及其风险传导路径,建立了100多种危险行为模式,全面量化企业风险状况,识别准确率达90%以上。

 

可视化处理

海量数据建模分析之后,将结果进行可视化处理,支持多种类型图表、终端展示,真正让用户看到数据的价值,用数据说话。

市场前景

2014年中央经济工作会议首次明确提出“大众创业、万众创新”,到2015年正式写入《政府工作报告》,近两年来,创业、创新已成为社会发展的一个主题词。2016年,在全球融资总额整体下降的大趋势下,我国融资总额逆势增长,涨幅为10%。2017上半年国内共发生2786例投资事件,融资总额达3252亿元,平均投资额度创历史新高。但是也发现几个问题,部分地区出现双创虚热,质量跑不过数量的线下;部分地区出现付出多、回报少的主体获得感低。少数地方在“双创”中出现的“浮、漂、虚”的现象值得高度警惕。如果通过大数据征信、风险、评价预警等平台,可以及时预判,使政府和机构在开展“双创”工作更加精准和有效。

同时,近年来政府对金融科技行业的监管更加严格了,行业乱象被清理,政府、企业、包括个人均越来越重视数据保护。市场上对私业务被监管、限制,对公业务需求则在持续稳定的增长。这对探码科技的发展来说是一个非常好的趋势,契合我们一直坚持做企业大数据智能评价服务的核心战略

市场对企业端智能大数据服务需求猛增。而基于此的大数据增值服务也将迎来黄金时代。在未来,大数据产业的核心竞争力将不再是数据,更多集中到对数据的分析、挖掘结果处理上,如何应用它给业务带来价值。

市场优势

数塔.Datale核心竞争力可包括三个部分:

 

数据获取能力

数塔.Datale的数据主要来自三方面,政府公开数据、第三方数据以及企业共享数据,具体而言包括工商信息、司法诉讼、新闻舆情、知识产权、财务、海关、互联网行为、企业交易数据等等,目前数塔.Datale已经积累了超过3000万家企业的数据,而且能够持续更新数据库,让评价系统的风险监控也变成实时动态的监控;

 

数据分析能力

包括数据清洗、数据挖掘和建模能力等。数塔.Datale具有20多人的数据处理团队,从事数据分析及评估模型开发等工作多年,数塔.Datale企业成长性评估模型经过违约样本的测试之后,验证准确率超过96%。在大数据和人工智能技术研发方面,公司专门成立了大数据研究小组,首席数据科学家是拥有十多年大数据和人工智能研究经验的专家

 

商业化能力

即如何将大数据和人工智能能力转化为可持续发展的产品和业务模式。数塔.Datale采用DaaS模式,依托自身数据服务优势,将其产品形态标准化、互联网化。目前服务的客户80%为政府园区机构客户,20%为企业和类金融机构。与传统的企业尽调方式相比,数塔.Datale能够帮助机构降低66%的风控成本,提3的决策能力支撑

 

 

蜀ICP备15035023号-4