当前位置:

Web爬取工具Anthelion v1.0

收藏
举报
Yahoo宣布开源解析HTML页面结构数据的Web爬取工具Anthelion。Web 爬行工具是Yahoo很重要的核心,甚至超过了其他应用:Yahoo Mail, Yahoo Finance, Yahoo Messenger, Flickr和Tumblr。上一年在上海的一次会议中,Yahoo 也详细提到了 Anthelion:“Anthelion 最初专注于语义数据,使用标记语言嵌入到
  • 作者:
    Yahoo
  • 演示网站:
    暂无
  • 当前版本:
    v1.0
  • 日期:
    2015-12-16
  • 相关链接:
    暂无
  • 所属分类:
    web应用开发 Java
  • 软件评级:
  • 下载人气:
    1906
免费下载
求购此源码
源码详情
免费下载
联系客服/入群
源码属性
作者 Yahoo
授权 开源
大小 36.24MB
语言 Java
运行环境 java
功能介绍
Yahoo宣布开源解析HTML页面结构数据的Web爬取工具Anthelion。
Web 爬行工具是Yahoo很重要的核心,甚至超过了其他应用:Yahoo Mail, Yahoo Finance, Yahoo Messenger, Flickr和Tumblr。
上一年在上海的一次会议中,Yahoo 也详细提到了 Anthelion:“Anthelion 最初专注于语义数据,使用标记语言嵌入到 HTML 页面,比如 Microdata,Microformat 或者 RDFa。”这次会议还提到了爬取技术是如何实现的,为什么能提供更高数量的特定搜索查询相关的结果。
Microdata 和 RDFa 是结构数据关于不同主题的语法格式,兼容 schema.org 词汇(一个 Google,Yahoo 和 Bing 搜索引擎都在研究的项目) a project that the Google, Yahoo, and Bing search engines all work on.
Anthelion 可以根据设定目标爬取特定页面,比如,包括标记描述影片和至少两个不同属性(比如电影标题和演员)。
付费服务
模板/插件

联系客服

手机版

扫一扫进入手机版

返回顶部