10年如一日的拼搏，造就了如今10亿的辉煌--粉丝服务平台-粉丝头条-fensifuwu.com

10年如一日的拼搏，造就了如今10亿的辉煌

科技 07-11 来源：创业家

老郝是天津静海县王口镇人。创业之前的3年间，他辞了工作，辗转各个大学图书馆查资料，白天炒股赚钱，晚上写代码，几乎彻底成了“宅男”。

中文分词是帮助计算机读懂中文的第一步，也是大数据和人工智能技术的基础。当时，中文分词准确率只能达到97%，3%的差误率是很多中文信息处理的瓶颈。由中科院、新闻出版总署、新华通讯社等部门发起的国家级项目《汉字信息处理系统工程》，也没有找到解决方案。

大学专业是情报学的老郝，后来进入了证券行业，他一直想把情报分析和二级市场投资结合起来，首先就遇到了计算机如何自动分析文本的问题，其中的基础技术中文分词，在当时号称是世界性难题。

终于，老郝99年底将中文分词的准确率从97%提升到了99.7%；2000年，刚刚成立的海量公司就承担了国家863计划项目《智能信息内容分析与识别》。

将中文分词技术卖给需要的公司。之后的很长一段时间里，公司一直没有大的盈利。03年，海量推出了第一款搜索产品“磐石引擎”，老郝放话说，“3个月后，中国搜索引擎，我们要争第一。”回归了底层技术的开发，先后研发出了基于视觉的网页分析、命名实体识别、句法分析、全文检索引擎、基于关键特征的模式识别引擎等核心技术，写了几部规范。

2013年，海量大数据情报分析平台建成，是业内首个支持多领域的互联网开源大数据分析平台。这年，老郝43岁了。

2012年至今，老郝孵化了20多家大数据相关的创业公司，最大的估值已经超过60亿，最近融资的数据可视化公司海云数据估值超过10亿。

到2016年，可视化被中国计算机学会(CCF)大数据专家委员会评为大数据领域最有潜力的发展方向。老郝投入的20万，得到了几千倍的回报。

分词中文数据

发表评论

留言与评论（共有 0 条评论）

相关文章

《煮糊了2》公布简体中文预告和专属特典

《煮糊了2》公布简体中文预告和专

战略数据刘戈杰：大数据为保险销售赋能提升理赔服务

战略数据刘戈杰：大数据为保险销售赋

这个国外团队准备借助区块链技术重构招聘市场，他们能否超越领英

这个国外团队准备借助区块链技术重

Facebook首次因数据泄密丑闻遭罚款：金额66.4万美元

Facebook首次因数据泄密丑闻遭罚款

“瑞普政法”用大数据助力公检法互联用一把尺子办案

“瑞普政法”用大数据助力公检法互

迈外迪CEO张程：数据资产是智能商业基石 | 2018商业新生态零售主题峰会

迈外迪CEO张程：数据资产是智能商业

网友投稿普通会员

我还没有学会写个人说明

356254 篇文章

11959535 次浏览

最近文章

'); })();