通过Betalist 分析近年创业项目

Author Tanmer Tanmer
Tanmer · 2024-10-18发布 · 353 次浏览

基于ruby 的正则化,机器学习,matplotlib对betalist 进行对数据进行可视化处理并进行分析。

本文通过Dyson Web数据采集器实现对Betalist的网络数据爬取,并通过简单的统计分类,对近年来发布在Betalist的创业项目进行了统计分析。 

目标:对https://betalist.com/markets(Betalist该网页上的数据进行分析


 

1.对数据进行采集并处理

使用工具:Ruby & Atom
(1)网站信息的采集(command+A/command+C/command+V)到atom的页面中

(2)正则化删除前面的图标

  • 在atom页面中,通过command+F调出正则替换框
  • 通过输入:[^a-zA-Z0-9 \t]的方式,后点击replace all删除图标

(3)通过正则化对其进行排版的处理(换行处理)

(4)更改成为字典的形式(在英文单词前后添加引号,数字和英文)

(5)至此,成功转化为字典的形式,下一步对整个字典进行排序,获得top 30
工具:python&pycharm 

(6)提取top 30 字典中的value,形成新的列表(list)


2.对数据进行可视化处理并进行分析
使用工具:python & matplotlib & pycharm 

  • 条形图

 

  • 三维散点图

 

  • 二维散点图

综上可得分析:

  1. 互联网&IT领域(Apps,productivity software, mobile,Saas),商业领域(businesses productivity)占据所有行业的领先位置
  2. 从横向条形图中仍可以发现Saas软件服务创业量占据领军位置的同时,远超top30中其余行业创业数量许多,以此预判Saas“软件暨服务”理念会引领软件行业的应用模式。
  3.  由二维图,三维图可知,top30行业的创业公司数量大多在200-400范围内,与top5的创业公司数量差距较大,以此判断,top5以外的行业竞争激烈,需找寻突破口。


 

提交反馈

博客 博客

专注数字内容治理,助力数字体验升级

搜索功能在IA信息架构中的重要指标和地位

搜索功能在IA信息架构中的重要指标和地位

本文探讨了企业搜索问题背后的深层原因,指出搜索“失效”往往源于内容策略、信息建模和用户体验的缺失,而不仅仅是搜索引擎本身的问题。通过引入 Baklib 全文检索 智能搜索,企业可优化知识管理体系,提升搜索相关性、及时性和针对性,从而真...

Author 8f1d
By Lisa
发布:2025-03-25
Baklib在软件科技行业的应用

Baklib在软件科技行业的应用

通过Baklib强大的文档管理、知识共享、客户支持和品牌内容展示功能,帮助软件科技企业提升内容体验和用户体验

Author application
By aQian
发布:2025-03-24
大数据时代的数字内容挑战:从创业到企业的内容治理之路

大数据时代的数字内容挑战:从创业到企业的内容治理之路

在数字化时代,内容治理成为企业与创业者面临的核心挑战。Baklib数字内容体验云平台提供模块化管理、高效分发与智能优化方案,助力教育、知识管理与产品文档领域的内容升级。通过数据驱动的优化策略,Baklib让内容管理更高效、可持续,助力...

Author dfab
By Lisa
发布:2025-03-17
分类法与信息架构实施指南:确保成功

分类法与信息架构实施指南:确保成功

本指南探讨了在信息架构实施过程中常见的挑战及应对策略,包括技术实现、搜索功能、用户体验、治理与安全以及工作流程管理。通过利用Baklib等智能知识管理工具,企业可以优化实施过程,提升管理效率,确保信息架构的可扩展性和用户体验。

Author 3126
By Lisa
发布:2025-03-12
人工智能的未来:从数据、算法、算力到知识的融合

人工智能的未来:从数据、算法、算力到知识的融合

人工智能的发展正在从纯粹的数据驱动走向数据与知识的融合。周志华教授提出的“反绎学习”为这一转变提供了理论框架和实践方法。随着AI技术进入新的阶段,知识的重要性将愈发凸显,未来的AI系统将不仅仅是“数据的奴隶”,而是能够充分利用人类智慧...

Author data-to-knowledge
By Baklib
发布:2025-03-05
跨越鸿沟与 AI 助力:Baklib 引领企业成功之路

跨越鸿沟与 AI 助力:Baklib 引领企业成功之路

杰弗里·摩尔在《跨越鸿沟》中指出,技术产品若未能在主流市场获得吸引力,便可能消亡。而为了成功推广创新产品,企业需专注于特定客户群体,并小心在早期采用者与早期多数者之间进行过渡。此外,人工智能的引入在各行业展现出显著的投资回报和效率提升...

Author d465
By Baklib
发布:2025-03-04
数字内容管理新突破:Baklib助力企业优化信息架构

数字内容管理新突破:Baklib助力企业优化信息架构

本文探讨信息架构(IA)对企业运营的基础性作用,强调其在营销、客户体验和数据治理等领域的影响。通过Baklib数字内容体验云平台,企业可以构建高效的知识管理系统,提升信息组织和内容展示,推动数字化转型与业务增长。

Author adf4
By Lisa
发布:2025-02-27
使用知识中台作为跨组织工作的文档存储的五个好处

使用知识中台作为跨组织工作的文档存储的五个好处

对任何组织来说,保持文档井然有序和可访问性是一项关键任务。在本地网络驱动器上存储文档的传统方法可能耗时且难以管理,并限制了谁可以访问。那么,当您想在多个组织之间轻松共享文档时,会发生什么?

Author 3e3f
By Lisa
发布:2025-02-27
通过打造信息架构,提供全渠道一致性的客户体验

通过打造信息架构,提供全渠道一致性的客户体验

随着业务数字化转型的推进,企业面临的全渠道挑战变得愈加复杂。如何在多种平台、设备和渠道之间提供一致且个性化的体验?Baklib通过优化信息架构,帮助企业应对这些挑战,确保能够高效地管理和交付一致的内容体验。

Author 9dec
By Lisa
发布:2025-02-27