网页结构化提取器
通过 AI 和结构化 Schema,从网页中提取公司联系人信息,包括公司名称、地址、邮箱、电话与社交媒体链接等字段。
网址列表
您可以输入或粘贴多个 URL,用空格、逗号或分号分隔。域名会自动补全 https://。
设置字段
已为您填好常用字段。如需自定义,请点击「展开更多」后编辑。
字段名
类型
描述
操作
来源 | companyName | companyDescription | contactEmails | contactPhone | companyAddress | socialMediaLinks |
---|---|---|---|---|---|---|
https://www.oschina.net | 北京奥思研工智能科技有限公司 | OSCHINA(开源中国)成立于 2008 年 8 月,已发展成为中国最大的开源与 AI 技术社区之一,提供开源资讯、软件、AI 创作、代码托管(Gitee)和一站式 DevOps、AI 平台等服务,致力于推动中国开源与 AI 技术发展。 | 0755-83170505 | 深圳市南山区西丽街道云科技大厦 22 楼 | https://www.oschina.net/, https://gitee.com/explore, https://ai.gitee.com/, https://gitee.com/about_us | |
https://www.csdn.net | CSDN(北京创新乐知网络技术有限公司) | CSDN是中国专业的开发者社区,提供最新技术资讯、编程教程、开源项目、AI搜索及互动交流平台,助力开发者成长与技术分享。 | 400-660-0108 | 未找到 | https://www.csdn.net/, https://blog.csdn.net/, https://download.csdn.net/, https://edu.csdn.net/?utm_source=zhuzhantoolbar, https://devpress.csdn.net/, https://ai.csdn.net/?utm_source=cknow_pc_homeleft, https://link.csdn.net/?target=https%3A%2F%2Fgitcode.com%3Futm_source%3Dcsdn_toolbar, https://inscode.csdn.net/?utm_source=260232576, https://summit.csdn.net/ | |
https://kaiyuanshe.cn/ | 开源社 | 开源社是中国领先的开源文化推广与实践组织,致力于推广开源理念、培育开源社区和推动开源生态发展。 | 未找到 | 北京市海淀区知春路 | https://github.com/kaiyuanshe, https://weibo.com/u/6446437797, https://kaiyuanshe.cn/ |
常见问题
关于网页结构化提取的常见问题
还有疑问?欢迎加入 Discord 社群或通过邮箱联系我们 😊
1
网页结构化提取器能做什么?
它可以从任意网页中提取出结构化字段,比如价格、标题、作者、产品详情、时间等。适用于资讯、商品、电商、博客等网页。
2
如何控制提取的字段结构?
你可以自定义 JSON Schema 来指定要提取的字段。支持字段命名、嵌套结构、列表等高级配置。
3
是否支持中文网页?
当然支持!不仅支持中文网页内容,还能根据中文提示词进行信息提取控制。
4
会受到网页布局影响吗?
不会。我们的 AI 引擎不依赖 HTML 结构,而是通过语言模型理解页面语义进行提取,更智能、更稳定。
5
适合哪些用户使用?
适合数据分析师、内容抓取、竞品监测、自动收录工具等,帮助自动化从网页中获取有用信息。