Meta部署新网络爬虫机器人，为其AI模型收集大量数据

来源：凤凰新闻 2024-08-21 赞(442) 评论(0)

官方 Lanisky网站建设：企业、政府、学校网站建设、开发、代运营（广州18820090892，深圳18007555088，微信同号）

官方 丰业合作社：广东省示范社，全国合作收购荔枝、圣女果、番石榴等，体验式入园采摘0759-6905386，15360737081 ）

北京时间8月21日，近日，Meta悄悄地发布了一款新的网络爬虫，用于搜索互联网并收集大量数据，为其人工智能模型提供支持。

据三家追踪网络抓取器的公司称，Meta新网络爬虫机器人Meta External Agent于上月推出，类似于OpenAI的GPTBot，可以抓取网络上的人工智能训练数据，例如新闻文章中的文本或在线讨论组中的对话。

根据使用档案历史记录显示，Meta确实在7月底更新了一个面向开发者的公司网站，其中一个标签显示了新爬虫的存在，但Meta至今还没有公开宣布其新爬虫机器人。

Meta的Llama是最大的llm之一，虽然该公司没有透露最新版本的模型Llama 3使用的训练数据，但其初始版本的模型使用了由Common Crawl等其他来源收集的大型数据集。

今年早些时候，Meta的联合创始人、首席执行官马克·扎克伯格(Mark Zuckerberg)在一次财报电话会议上曾吹嘘说，公司的社交平台已经积累了一套用于人工智能训练的数据集，甚至“超过了Common Crawl”。

新爬虫的存在表明Meta庞大的数据库可能已经不够用了，因为该公司继续致力于更新Llama和扩展Meta AI，通常需要新的和高质量的培训数据来不断改进功能。

来自Dark Visitors的数据显示，全球近25%的最受欢迎的网站现在已屏蔽了GPTBot，但只有2%的网站屏蔽了Meta的新爬虫机器人。(作者/余青)

百度搜索《Meta部署新网络爬虫机器人，为其AI模型收集大量数据》。如本文侵权，请把本文相对应的原创链接及文章作者证明发至邮箱admin@lanisky.cn，核实后本站即删除。

网友评论更多评论(0)

资讯赞助

官方 网站建设：企业、政府、学校网站建设、开发、代运营（广州18024001939，深圳18007555088，微信同号）

官方 全能站长：网站运营、编辑、设计，每月花20000元请3个人？No!你花了十倍冤枉钱! 每月最低仅需375元，「全能站长」统一包起网站运营+编辑+设计+推广+服务器维护工作! 点击了解详情，微信18007555088详谈

lanisky® 推荐服务
翘楚商务：华夏多翘楚，天涯若比邻！欢迎免费入住，免费建立官网，免费进行商务推广，与数以万计的企业做邻居！马上入住>>
品牌展板：5分钟免费“上市”，打造专业完美的品牌展板，欢迎企业、网站、社团、院校、村镇、商店等！马上入住>>

Meta部署新网络爬虫机器人，为其AI模型收集大量数据

网友评论更多评论(0)

资讯赞助

热门资讯

推荐资讯

Meta部署新网络爬虫机器人，为其AI模型收集大量数据

网友评论 更多评论(0)

资讯赞助

热门资讯

推荐资讯

网友评论更多评论(0)