关于我们
关于DM
DM实验室将毕生的精力投入到半结构化数据模式抽取的研究,至今取得了可视化用户体验技术和结构特征模式抽取技术的重大成果。◇可视化用户体验
数据可以用图象、曲线、二维图形、三维体和动画来显示,并可对其模式和相互关系进行可视化分析。
◇半结构化数据模式抽取
模式抽取指的是从半结构化数据中自动发现数据的结构特征。模式抽取在半结构化数据研究领域中具有重要意义,它是数据挖掘的基础。
关于作者
◇理论研究员
致力于人工智能信息挖掘以及半结构化数据模式发现等领域的理论研究。希望给当今搜索引擎带来新的变革。鄙人将毕生的精力贡献给了我的梦想,丢失了凡人的酸甜苦辣。梦想自己能够成功,以报答亲人对我的付出。
◇高级工程师
本人擅长于java技术开发和架构设计,具有丰富的WEB开发经验。和兄弟姐妹们一样默默地从事了5年的打字劳动。蓦然回首,昔日的点点息息竟也能让人有一种异样的感动,虽然至今仍一贫如洗,但有时也会为过去的成就感到过骄傲和自豪。
◇惭愧的丈夫
和她相伴已经4年了,生活的拮据让我万分惭愧。她,视为我的财富和骄傲,早已成为我的心灵港湾和良师益友。没有了她,我的人生定会少了很多的动力和精彩!
关于产品
我坚信WEB数据抽取一定具备很大的应用价值,带着这个信念,一直坚持研究半结构化数据的抽取技术。风风雨雨走过来,很欣慰的是,终于取得了实质性的成果。 我相信开放才有发展,易用才受欢迎,所以我几乎公布了所有的设计文档,并且站在用户体验的角度上设计产品。 网站采集系统具有如下几个特殊特征:- 公开设计文档,让所有人认识产品,理解产品,发展产品。
- 可视化技术,让所有的用户易于使用,随心所欲。
- WEB结构,让所有的用户随处随时随意地接触到它。
- 先进的抽取技术,让用户的每次抽取定义都成为自己的一次创意之举。
大事记
-
2004年5月
开发技术型个人网站,蹦出网站采集这个概念,而后全力转为网站采集软件的开发。 -
2005年1月
学习和研究数据挖据和模式识别技术,研发出国际领先的"HTML可视化抽取算法设计"的数据抽取技术。 -
2005年11月
开发出第一款网站采集器。 -
2006年5月
构思开源社区,寻求发展信息采集技术,建立开源网站www.java51.com。 -
2006年12月
《视采采集器需求分析》、《视采采集器技术方案》、《HTML可视化抽取算法设计》、《视采采集器产品白皮书》编写完成,并公开于网络。 -
2007年9月
视采采集器、DMCMS内容管理系统开发成功。 -
2008年12月
视采采集器做了大量的重构动作,加强了xml数据的处理能力,系统采用了可插拔的插件体系。 -
2009年2月
视采采集器正式上线。

