基于ruby 的正则化,机器学习,matplotlib对betalist 进行对数据进行可视化处理并进行分析。
1.对数据进行采集并处理

- 在atom页面中,通过command+F调出正则替换框
- 通过输入:[^a-zA-Z0-9 \t]的方式,后点击replace all删除图标






工具:python&pycharm




2.对数据进行可视化处理并进行分析
使用工具:python & matplotlib & pycharm
- 条形图


- 三维散点图


- 二维散点图


- 互联网&IT领域(Apps,productivity software, mobile,Saas),商业领域(businesses productivity)占据所有行业的领先位置
- 从横向条形图中仍可以发现Saas软件服务创业量占据领军位置的同时,远超top30中其余行业创业数量许多,以此预判Saas“软件暨服务”理念会引领软件行业的应用模式。
- 由二维图,三维图可知,top30行业的创业公司数量大多在200-400范围内,与top5的创业公司数量差距较大,以此判断,top5以外的行业竞争激烈,需找寻突破口。

博客