老郝是天津静海县王口镇人。创业之前的3年间,他辞了工作,辗转各个大学图书馆查资料,白天炒股赚钱,晚上写代码,几乎彻底成了“宅男”。
中文分词是帮助计算机读懂中文的第一步,也是大数据和人工智能技术的基础。当时,中文分词准确率只能达到97%,3%的差误率是很多中文信息处理的瓶颈。由中科院、新闻出版总署、新华通讯社等部门发起的国家级项目《汉字信息处理系统工程》,也没有找到解决方案。
大学专业是情报学的老郝,后来进入了证券行业,他一直想把情报分析和二级市场投资结合起来,首先就遇到了计算机如何自动分析文本的问题,其中的基础技术中文分词,在当时号称是世界性难题。
终于,老郝99年底将中文分词的准确率从97%提升到了99.7%;2000年,刚刚成立的海量公司就承担了国家863计划项目《智能信息内容分析与识别》。
将中文分词技术卖给需要的公司。之后的很长一段时间里,公司一直没有大的盈利。03年,海量推出了第一款搜索产品“磐石引擎”,老郝放话说,“3个月后,中国搜索引擎,我们要争第一。”回归了底层技术的开发,先后研发出了基于视觉的网页分析、命名实体识别、句法分析、全文检索引擎、基于关键特征的模式识别引擎等核心技术,写了几部规范。
2013年,海量大数据情报分析平台建成, 是业内首个支持多领域的互联网开源大数据分析平台。这年,老郝43岁了。
2012年至今,老郝孵化了20多家大数据相关的创业公司,最大的估值已经超过60亿,最近融资的数据可视化公司海云数据估值超过10亿。
到2016年,可视化被中国计算机学会(CCF)大数据专家委员会评为大数据领域最有潜力的发展方向。老郝投入的20万,得到了几千倍的回报。
留言与评论(共有 0 条评论) |