通过Betalist 分析近年创业项目

Author Tanmer Tanmer
Tanmer · 2024-10-18发布 · 518 次浏览

基于ruby 的正则化,机器学习,matplotlib对betalist 进行对数据进行可视化处理并进行分析。

本文通过Dyson Web数据采集器实现对Betalist的网络数据爬取,并通过简单的统计分类,对近年来发布在Betalist的创业项目进行了统计分析。 

目标:对https://betalist.com/markets(Betalist该网页上的数据进行分析


 

1.对数据进行采集并处理

使用工具:Ruby & Atom
(1)网站信息的采集(command+A/command+C/command+V)到atom的页面中

(2)正则化删除前面的图标

  • 在atom页面中,通过command+F调出正则替换框
  • 通过输入:[^a-zA-Z0-9 \t]的方式,后点击replace all删除图标

(3)通过正则化对其进行排版的处理(换行处理)

(4)更改成为字典的形式(在英文单词前后添加引号,数字和英文)

(5)至此,成功转化为字典的形式,下一步对整个字典进行排序,获得top 30
工具:python&pycharm 

(6)提取top 30 字典中的value,形成新的列表(list)


2.对数据进行可视化处理并进行分析
使用工具:python & matplotlib & pycharm 

  • 条形图

 

  • 三维散点图

 

  • 二维散点图

综上可得分析:

  1. 互联网&IT领域(Apps,productivity software, mobile,Saas),商业领域(businesses productivity)占据所有行业的领先位置
  2. 从横向条形图中仍可以发现Saas软件服务创业量占据领军位置的同时,远超top30中其余行业创业数量许多,以此预判Saas“软件暨服务”理念会引领软件行业的应用模式。
  3.  由二维图,三维图可知,top30行业的创业公司数量大多在200-400范围内,与top5的创业公司数量差距较大,以此判断,top5以外的行业竞争激烈,需找寻突破口。


 

提交反馈

博客 博客

专注数字内容治理,助力数字体验升级

实现内容可访问性的意义与实践:构建包容性数字体验

实现内容可访问性的意义与实践:构建包容性数字体验

内容可访问性旨在确保所有用户(包括残障人士)都能顺畅浏览、理解并交互数字内容,是构建包容性数字体验的关键。本指南解析内容可访问性的定义、价值、适用行业与 WCAG 核心原则,并涵盖文本可读性、媒体替代文本、导航交互、表单设计及色彩对比...

Author b6bb
By Lisa
发布:2025-12-08
从信息壁垒到高效信息分享:全面解析如何打破组织孤岛

从信息壁垒到高效信息分享:全面解析如何打破组织孤岛

组织孤岛会造成部门间信息封闭,影响沟通与协作,导致生产力下降和目标不明确。本文介绍了组织孤岛的表现、影响以及如何通过统一目标、知识共享、工作流程管理等策略打破孤岛,提高公司整体效率与增长。采用Baklib平台等协作工具,有助于实现无缝...

Author organizational-silos
By Lisa
发布:2025-12-08
释放全渠道体验潜力:构建统一的内容与设计运营体系

释放全渠道体验潜力:构建统一的内容与设计运营体系

随着数字渠道的激增,企业需要应对内容和设计的碎片化问题。通过无头内容管理系统(Headless CMS)和COPE理念,企业可以实现“一次创作,全域发布”,优化跨渠道内容分发和用户体验。Baklib数字内容体验云平台提供全渠道解决方案...

Author 9866
By Lisa
发布:2025-12-04
如何利用单一事实来源(SSOT)优化SaaS业务流程与客户体验

如何利用单一事实来源(SSOT)优化SaaS业务流程与客户体验

单一事实来源(SSOT)是整合多个系统和数据的关键,帮助SaaS企业提高数据一致性、减少重复、打破数据孤岛,并提高整体生产力。通过实施SSOT,企业能够优化工作流程、促进部门协作、提高客户满意度。本文将探讨SSOT的好处、创建步骤及其...

Author creating-a-single-source-of-truth
By Lisa
发布:2025-12-04
知识管理的复兴与十大典型用例

知识管理的复兴与十大典型用例

本文基于 Baklib 平台,总结知识管理十大典型用例,展示其在共享、学习、创新与 AI 转型中的价值,助力企业智能化升级。

Author cfab
By Lisa
发布:2025-10-28
内容与语义层:释放企业知识资产的潜能

内容与语义层:释放企业知识资产的潜能

语义层通过为内容添加上下文与结构,实现数据与知识的智能连接。借助 Baklib 平台,企业可将分散内容整合为统一知识体系,提升内容管理、搜索与智能决策能力。

Author f871
By Lisa
发布:2025-10-23
葡萄酒 + 数字产权:ZWine 葡萄酒数字资产引领行业新变革​

葡萄酒 + 数字产权:ZWine 葡萄酒数字资产引领行业新变革​

随着数字技术的不断进步和行业的持续探索,“葡萄酒 + 数字产权” 模式有望成为葡萄酒行业发展的新趋势。ZWine 葡萄酒数字资产作为行业先行者,若能有效应对当前面临的问题与挑战,不断优化平台功能和服务,将引领葡萄酒行业进入数字化发展的...

Author zwine
By 巴克励步
发布:2025-10-17
企业级CMS选型深度指南(2025版)

企业级CMS选型深度指南(2025版)

企业级CMS选择关乎战略成败。本文总结2025年顶尖CMS平台特性与适用场景,提供评估标准与实践经验,助力企业打造高效、安全、可扩展的内容中枢。

Author 73d0
By Lisa
发布:2025-09-15