Lanisky 蓝粤网 巅峰资讯
巅峰科技报道
首页 > 巅峰资讯 > 巅峰科技报道 > 科技综合

Meta推出新的AI模型 可转录和翻译近百种语言

来源:财联社   2023-08-24  赞(31)  评论(0)

官方 Lanisky网站建设:企业、政府、学校网站建设、开发、代运营(广州18820090892,深圳18007555088,微信同号)

官方 丰业合作社:广东省示范社,全国合作收购荔枝、圣女果、番石榴等,体验式入园采摘0759-690538615360737081

①Meta周二发布了一个名为SeamlessM4T的人工智能模型,可以翻译和转录近百种语言;

②对于语音转语音和文本转语音的操作,SeamlessM4T可以识别100种输入语言,并将其转换为35种输出语言。

财联社8月23日讯(编辑 夏军雄)当地时间周二(8月22日),Meta发布了一个名为SeamlessM4T的人工智能(AI)模型,可以翻译和转录近百种语言。

据Meta介绍,SeamlessM4T可以翻译近100种语言的语音到文本和文本到文本。对于语音转语音和文本转语音的操作,它可以识别100种输入语言,并将其转换为35种输出语言。

SeamlessM4T是根据知识共享许可(CC) 协议4.0发布的,允许研究人员对其进行迭代。

除了SeamlessM4T,Meta还发布了其开放翻译数据集SeamlessAlign的元数据。

Meta表示:“建立一个通用语言翻译器,例如像《银河系漫游指南》中虚构的巴别鱼那样,是具有挑战性的,因为现有的语音对语音和语音对文本系统只覆盖了世界语言的一小部分。”

《银河系漫游指南》是由英国作家道格拉斯·亚当斯所写的一系列科幻小说,而巴别鱼是这部作品所创造的一种神奇生物,体型小到足以放进人的耳朵,靠接受脑电波为生。如果将巴别鱼放到耳朵里,人们可以理解任何语言。

对于SeamlessM4T模型,Meta研究人员在一篇研究论文中表示,他们从400万小时的原始音频中收集了音频训练数据,这些音频来自一个公开的抓取网络数据存储库,但没有说明是哪个存储库。

研究报告称,文本数据来自去年创建的数据集,这些数据集从维基百科和相关网站上提取了内容。

Meta表示,SeamlessM4T代表了一个重大突破,因为这个模型可以一次性完成整个翻译任务,而不像其他大型翻译模型那样,将翻译分成不同的系统。

SeamlessM4T建立在Meta之前的翻译模型之上。Meta去年发布了支持200种语言的文本到文本的翻译模型。它开发了用于多语言语音到语音翻译的数据集,以及用于语音识别的大规模多语言语音。Meta去年展示了它的通用语音翻译器,可将闽南语转化为英语。

百度搜索《Meta推出新的AI模型 可转录和翻译近百种语言》。如本文侵权,请把本文相对应的原创链接及文章作者证明发至邮箱admin@lanisky.cn,核实后本站即删除。



网友评论 更多评论(0)


发表评论 默认免登陆匿名发表
   

资讯赞助

官方 网站建设:企业、政府、学校网站建设、开发、代运营(广州18024001939,深圳18007555088,微信同号)

官方 全能站长:网站运营、编辑、设计,每月花20000元请3个人?No!你花了十倍冤枉钱! 每月最低仅需375元,「全能站长」统一包起网站运营+编辑+设计+推广+服务器维护工作! 点击了解详情,微信18007555088详谈
  • lanisky® 推荐服务
  • 翘楚商务:华夏多翘楚,天涯若比邻!欢迎免费入住,免费建立官网,免费进行商务推广,与数以万计的企业做邻居!马上入住>>
  • 品牌展板:5分钟免费“上市”,打造专业完美的品牌展板,欢迎企业、网站、社团、院校、村镇、商店等!马上入住>>
Lanisky公司成立于2015年,是互联网+产业创新服务商,以云计算、网站建设开发和网站运营为主要业务,为广大客户提供专业性强、整合度高的互联网信息化解决方案...[详情]
  

Lanisky中国公司
深圳市福田区文化体育产业总部大厦 / 13922266979
广州市增城区新塘镇南安西石窿C幢 / 13423640808
湛江市廉江市良垌镇平田济村 / 15360737081
service@lanisky.cn
详细联系方式

自媒体


微信公众号

微信视频号

微信洽谈
百家号 / 今日头条 / 微博 / 领英 / RSS订阅

首页 | Lanisky公司 | 关于我们 | 公司资讯 | 资料中心 | 联系我们 | 在线客服 | 反馈中心 | 网站条款 | 友情链接

©2007- Lanisky All rights reserved.