Diffbot
Diffbot是一家小而美的初创公司,该公司通过计算机视觉、机器学习和人工智能来处理Web页面,并计划实现整个网页的“机器可读”。不久前Diffbot发布了新的API,可以帮助用户将产品网页转化为可重用的数据,进而用以定价分析和产品追踪,以及其他方面的一些应用。
Diffbot的理念就是通过“视觉机器人”来扫描和识别不同的网页类型(主要是非结构化的数据),再将这些丰富的数据源应用于其他应用。Diffbot创始人兼首席执行官Mike Tung表示:“我们在获取页面之后会对其进行分析,然后通过成熟先进的技术进行结构化的处理。”
Diffbot的API使用计算机视觉将网页信息转化成数据库,软件开发者可以提取其中的数据进行再次利用,包括产品图片、航运成本、折扣价格、SKU码以及建议零售价等等。(信息来源于CloudTimes)
Diffbot将大多数Web页面划分为数个大类——新闻消息,头版,图片,事件和概要等等。Diffbot 首先识别这些部分,然后转化为可用的数据库格式。该公司已经发布了头版API和文章API,还有产品API。
Diffbot的理念就是通过“视觉机器人”来扫描和识别不同的网页类型(主要是非结构化的数据),再将这些丰富的数据源应用于其他应用。Diffbot创始人兼首席执行官Mike Tung表示:“我们在获取页面之后会对其进行分析,然后通过成熟先进的技术进行结构化的处理。”
Diffbot的API使用计算机视觉将网页信息转化成数据库,软件开发者可以提取其中的数据进行再次利用,包括产品图片、航运成本、折扣价格、SKU码以及建议零售价等等。(信息来源于CloudTimes)
Diffbot将大多数Web页面划分为数个大类——新闻消息,头版,图片,事件和概要等等。Diffbot 首先识别这些部分,然后转化为可用的数据库格式。该公司已经发布了头版API和文章API,还有产品API。