首页| JavaScript| HTML/CSS| Matlab| PHP| Python| Java| C/C++/VC++| C#| ASP| 其他|
购买积分 购买会员 激活码充值

您现在的位置是:虫虫源码 > 其他 > 网页是组成互联网的基本数据单元

网页是组成互联网的基本数据单元

  • 资源大小:7 K
  • 上传时间:2022-04-20
  • 下载次数:0次
  • 浏览次数:0次
  • 资源积分:1积分
  • 标      签: 互联网 数据单元

资 源 简 介

网页是组成互联网的基本数据单元,是各种面向互联网的应用系统最原始的数据源。网页内部含有大量噪音信息,如何从网页中有效地提取有价值的内容成为影响数据处理效果的关键。 网页正文提取指的是从原始网页中精确地提取出正文文本,比如提取新闻网页中的报道内容。能否高效地提取出网页的正文
VIP VIP
0.292829s