Mozilla更新公共语音数据集现在包括18种语言1400小时语音_业界资讯

来自：cnBeta

时间：2019-03-01

阅读：

Mozilla希望让初创公司，研究人员和业余爱好者更容易构建支持语音的应用，服务和设备。为此，它今天发布了最新版本的Common Voice，这是一个开源的语音数据集，现在包括来自42000名贡献者超过1400小时的语音样本，涵盖18种语言，包括包括英语、法语、德语、荷兰语、Hakha Chin语、世界语、波斯语、巴斯克语、西班牙语、中文、威尔士语和卡布语。

Mozilla声称，它是同类语言中最大的多语言数据集之一，比8个月前公开的普通语音语料库要大得多，其中包含了2万名英语志愿者500小时，40万份录音，而且语料库很快就会扩大。该组织表示，70种语言的数据收集工作正在通过通用语音网站和移动应用程序积极开展。

通用语音可以集成到Deepspeech中，这是一套由Mozilla的机器学习小组维护的开源的语音到文本、文本到语音引擎和经过培训的模型，它不仅包含语音片段，还包含一些自愿者提供的元数据，这些元数据可用于培训语音引擎，如演讲者的年龄、性别等等。

为了简化流程，Mozilla本周推出了一款改进的Common Voice网络工具，可以根据不同的提示进行剪辑，还提供了用于查看、重新录制和跳过剪辑的新控件。此外，它还推出了新的配置文件功能，允许用户跨语言跟踪进度和指标，并添加人口统计信息。Mozilla表示，在接下来的几个月里，它将尝试不同的方法来通过社区努力和新的合作伙伴关系，增加数据的数量和质量。最终目标旨在为那些寻求构建和使用语音技术的人提供更多更好的语音数据。

网易近日上线了一款名为“网易小蜜蜂”的App，这是一款针对年轻人的内容社区产品，旨在分享和交流日常生活。目前仅支持手机号登录，用户在注册时需选择就业状态，可以选

2024-11-27 20:27:27

2024年第三季度，全球TWS真无线耳机市场持续增长，根据Canalys科纳仕咨询报告显示，全球出货量达到9230万台，同比增长15%。苹果凭借AirPods 4及ANC版本，以21%的市场份额继续领跑市场

2024-11-27 20:27:07

近日，贴吧上一位用户发帖讨论《黑神话：悟空》是否会登上2024年春晚的舞台，这一话题迅速引发了广大玩家的热议。相关话题甚至登上了贴吧的热议榜单。作为首个国产3A大作，“

2024-11-27 20:26:44

今日，索尼在PlayStation 30周年纪念官网首次公开了PS2的销量数据。自2000年发布以来，PS2全球销量已突破1.6亿台，超越任天堂旗下NDS（1.54亿）和Switch（1.46亿），成为有史以来最畅销的游

2024-11-27 11:59:55

苹果即将在明年推出其超薄设计的新机型——iPhone 17 Air，这款新手机将是苹果史上最薄机型，厚度在5mm到6mm之间。然而为了轻薄，不可避免的就是在某些规格上的妥协，最

2024-11-27 11:57:36

据媒体报道，任天堂社长在最近的股东大会上明确表示，公司将采取措施打击黄牛行为，确保玩家能够顺利购买到下一代Switch主机。报道称，任天堂为了应对可能的黄牛问题，计划在新主机发

2024-11-27 11:57:17

据媒体报道，Windows 11 24H2版本最近又出现了新的问题，受影响的主要是华硕和戴尔两个品牌的笔记本，但也可能影响其他品牌用户。戴尔在文档中确认，当用户在安装了戴尔加密应用（Del

2024-11-27 11:56:54

今天为大家带来的是韩国小姐姐“kxbatx”的COS，黑丝白丝固然好看、光腿也别具风情啊~首位就是游戏《崩坏：星穹铁道》中的花火，游戏为了突出花火的热情和自由奔放，她的

2024-11-25 23:40:55

在多人射击游戏《星河战队：灭绝》正式版发售一个月后，索尼公布了VR游戏《星河战队：连续体》。电影里饰演主角强尼·瑞哥的卡斯派·范·戴恩，继续在这款游戏中

2024-11-25 23:38:46

《王者荣耀》宣布S38新版本迎来大变化。结算部分，在现有金牌和银牌的基础上，如果结算评分到达16.0，就会升级获得一个顶级分路评价，一次获胜可以加三颗星。此外，新版本还将对结算

2024-11-25 21:14:35

微信鸿蒙原生版今日发布了全新内测，版本号为1.0.2.16。新版加入了文件发送（安全访问）、聊天引用、小程序搜索、视频号、群聊折叠、拍一拍、朋友圈标签、新好友分类等功能，使用体

2024-11-25 21:14:12

微信110提醒，近期有诈骗分子假冒Apple官方通过短信向用户发送虚假信息，声称“Apple账户出现异常”等理由，诱导用户点击附带的陌生链接。这些链接打开的页面会提示用

2024-11-25 21:13:49

Intel Battlemage二代锐炫独立显卡即将发布，官方网站上已经多次明确提及，表明官方针对新产品的相关工作正在紧锣密鼓地推进。比如oneAPI Match Kernel，比如Intel PMT平台监控技

2024-11-25 21:13:28

今天，网易云音乐公开喊话QQ音乐，称其自定义播放器背景等功能为抄袭，要求QQ音乐少一点跟随式“更新”，多一点真正的创新。之后，网易云音乐小秘书在评论区再次发声，称目前

2024-11-25 21:13:10

盲目相信导航并不可取，走错路事小，丢掉性命就真的悲剧了。据印度当地媒体报道，当地时间11月23日，印度三名男子驱车前往婚礼现场途中从立交桥上坠落，三人均不幸身亡。报道称，当时三

2024-11-25 21:10:28

今日@网易云音乐发布公告，直接喊话QQ音乐：要求其立即停止剽窃式“创新”、借鉴式“创意”、以及跟随式“更新”的行为。网易云音乐在声明中称

2024-11-25 21:09:56

经历Ampere、Ada两代GPU规模精简之后，RTX 5090再一次“膨胀”——不仅核心面积暴增了22%，功耗也一路飙升到600W。据MEGAsizeGPU最新爆料，RTX 5090的Blackw

2024-11-25 21:09:34

据媒体报道，近日新加坡国立大学团队，在20多个场景下对Claude的电脑操控能力进行了全面测试。结果显示，AI不仅能自动完成手游日常任务，还能执行复杂的办公任务。研究中选用了米哈

2024-11-25 21:09:08

苹果Mac产品行销副总裁Tom Boger和平台架构副总裁Tim Millet在接受采访时，分享了其自研芯片Apple Silicon成功的秘诀。Millet指出，竞争对手的芯片制造商“无法直接采用第

2024-11-18 10:05:47

据报道，英伟达新款Blackwell AI芯片已经面临延迟，并且伴随着配套服务器出现的过热难题，这一连串的挑战引发了用户对于新数据中心能否如期启动并顺利运行的深切忧虑。据内部消息

2024-11-18 10:05:25

Mark Gurman爆料，苹果将在明年推出AirTag 2，爆料称全新的AirTag 2将升级芯片，并改进了位置跟踪功能，能在更远的距离内响应。Mark Gurman还透露，这款设备的代号是B589，它内置的扬声

2024-11-18 10:05:02

NVIDIA Blackwell架构的新一代服务器正在批量出货，而在OCP Summit 2024峰会上，官方进行了公开展示，而且是直接将芯片裸露在外，随便看。这台服务器一共配备了八颗B200芯片，4NP工艺

2024-11-17 23:04:05

Intel锐炫独立显卡会在下个月有一场好戏，但细节不详，现在又有了更进一步的消息。有曝料者贴出了一张预告海报，上边写着Intel锐炫、Battlemage SoC、2024年12月等字样，再次证实In

2024-11-17 21:23:54

技嘉发布了一款新的专业显卡Radeon PRO W7800 AI TOP 48G，一如其名拥有多达48GB显存，比之前的32GB版本增加了一半，可以更好地用于AI大模型训练。AMD去年4月发布了首批两款基于R

2024-11-17 21:23:28

据媒体报道，近日全球范围内的苹果用户报告称，他们收到了多年前参与以旧换新计划的iPhone所购买的AppleCare+服务费退款。这些退款涵盖了从iPhone 11 Pro到iPhone 14 Pro的多种

2024-11-17 21:23:09

随着iPhone、Mac等产品逐渐成熟，苹果也在积极尝试不同领域，据媒体报道，苹果正探索三个主要方向来推出新产品。方向一：AirPods转型分析师郭明錤预测，未来的AirPods Pro 3可能会加

2024-11-17 16:03:46

据媒体报道，谷歌的AI聊天机器人Gemini近日又引起了争议。一名密歇根州的研究生在使用该机器人辅助作业时，突然向用户发送了“请去死”的恶意信息。Gemini回复道：&ldq

2024-11-17 16:03:26

在近日的一次采访中，Intel技术传播经理Florian Maislinger证实，Intel正在开发具有大缓存产品。但这些产品将主要针对数据中心市场，而非主流的消费级市场，因为与服务器市场相比，游

2024-11-17 16:03:09

为庆祝经典游戏《半条命2》正式发行20周年，V社宣布在北京时间11月19日凌晨2点之前，用户可以在Steam平台上免费获取这款游戏。这款游戏在国区原价为42元，整体评价为好评如潮。而

2024-11-17 16:02:34

显示专家Ross Young在社交平台上表示，最新的M4 MacBook Pro使用量子点（QD）薄膜，而不是红色KSF荧光粉薄膜。过去苹果通常采用KSF解决方案，因为它的成本低，而且不含镉，但最新的无镉QD

2024-11-17 10:30:19

经过长达数月的等待，今天微软终于面向Slow通道用户发布了Windows 10 19H1（Version 1903）分支的预览版，最新版本号为Build 18342.8。这意味着自该版本开始微软将重心放在BUG修复

2019-02-28 20:59:51

使用智能手机的用户大都知道，五花八门的软件、APP经常会出现“系统升级”或者“版本更新”的提醒，一般情况下也没有引起太多的关注。而近日，网上一张疑似

2019-02-27 22:10:17

经过一年多的开发和测试，TinyMCE 5 正式版发布了！该版本可用于生产环境，TinyMCE 5 为开发者在集成和构建在线编辑器方面带来了显著的提升，对设计师而言可以无缝的植入到已有产品

2019-02-27 22:08:54

最近，Mozilla在第66版的Firefox中添加了Windows Hello支持。如果您在Windows 10设备上设置了Windows Hello以使用生物特征指纹或面部识别或PIN或通过FIDO2安全设备登录Window

2019-02-27 21:56:59

Mozilla Firefox 66 Beta 11今日发布，开发团队计划在 Firefox 66 中新增一个功能，该功能在默认情况下将阻止浏览器中的自动播放声音。 Mozilla 遵循 Google 的实现，它在 Chrome

2019-02-27 21:54:18

针对CentOS 6和Red Hat Enterprise Linux 6操作系统系列的重要内核安全更新已经发布，以解决最近发现的漏洞和其他错误。最主要的漏洞由红帽产品安全团队标记为具有“重

2019-02-27 21:51:22

微软刚刚发布了新款HoloLens 2虚拟现实设备，公司主管Alex Kipman还宣布，微软真的希望结束“围墙花园”模式，产品应该是开放的，包括其他网络浏览器和其他应用程序商店

2019-02-25 17:34:17

百度在2019年貌似没出现什么算法，但是在2月份刚过不久被站长吐槽网站被大规模的降权，此次波动造成的影响并非一般，不少超级大站一夜回到解放前，流量下滑的厉害。如：site机电之家

2019-02-24 23:44:23

2019年2月22日，NVIDIA发布了GeForce GTX 1660 Ti，一款全新的游戏GPU，它让当今最受欢迎的游戏的性能和能效比向前迈进了一大步。目前售价为2199元起。基于第12代TuringTM GPU架

2019-02-23 08:47:57

早前有报道称，苹果将在 Safari 12.1 中移除“请勿追踪”（Do Not Track）的选项，转而为用户提供更加智能的追踪防护体验。现在，根据苹果 WebKit 博客上分享的信息 &mdash

2019-02-22 18:19:41

2018-09-24

2019-02-01

2019-09-12

2019-04-09

2020-03-30

2019-06-25

2019-04-24

2019-09-23

2019-09-21

2020-03-25

Mozilla更新公共语音数据集 现在包括18种语言1400小时语音

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道

Mozilla更新公共语音数据集现在包括18种语言1400小时语音