南宫28NG相信品牌的力量
全部
All
当前位置: 首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧
相关新闻
  • 怎样做出“千人千面”的网站设计创意?

    2026-05-25 21:16

    我们都知道在网站开发的信息列表页面,每一项的名称、时间、摘要只是样式区别却未经组织,就会变得不那么容易阅读,尤其在列表项很多的时候,将拥挤不堪,让人窒息。网站开发实际的处理方式仅仅是采用了合

  • 404页面制作是重要的,那么该如何制作呢?

    2026-05-18 14:11

    网站建立404页面重要性在浏览网站的过程中,我们或多或少都会点击到一些网站的死链,然后会出现一个创意页面,这是网站的404页面。好的404页面能让用户感到放松,网站即使出现了死链,也不会使用

  • 一场不能输的战役即将打响——支付公司的“逐鹿之战”

    2026-05-13 07:27

    流量红利逐渐消失,消费互联网网站开发的增长进入瓶颈期,产业互联网却正在迎来高光时刻。“在美国,toB市场的收获基本与toC市场持平,而中国过去二十多年的互联网网站开发创投发展,主要获取回

  • 什么是网站开发的视差特效?

    2026-05-08 19:18

    目前已经有非常多国外的大型网站开发已经很重视这种网站开发效果了。在人们越来越追求新颖别致和更加逼真的动画效果的时代,视差效果很好的填补了这一个趋势,今天北京网站开发南宫28NG相信品牌的力量就和大家一起了解

  • 中国5G技术在未来处于什么发展前景

    2026-05-03 09:55

    第五代通信技术,简称5G,是最新一代蜂窝移动通讯技术,也就是4G、3G和2G系统之后的延伸。5G的性能目标是网站开发高数据速率、减少延迟、节省能源、降低成本、提高系统容量和大规模设备连接。

谷歌用AI从嘈杂环境中提取独立音轨:或存隐私担忧

返回列表
发布时间:2026-05-22 11:26
北京时间4月16日早间消息,谷歌研究人员开发了一种深度学习系统,可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示,该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样,可以主动关注一个声源,同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型,使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频,演示这项技术的实际效果。
谷歌表示,这项技术可以适用于单音轨视频,而且可以通过算法分离出视频中不同人的音频内容,也可以让用户手动选取视频中的人脸,专门收听此人的声音。
谷歌表示,视觉元素是关键,因为这项技术会关注一个人的嘴唇运动,从而更好地判断某个时点应该关注哪段声音,并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型,总共提取了大约2000小时的内容,然后将这些音轨混合后,添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图,把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸,并为每个人制作一段独立的音轨。
谷歌认为,隐藏式字幕系统会成为该系统的一大应用领域,他们还在设想更广泛的应用方向,而且还在探索更多的机会,希望将其整合到各种谷歌产品中。例如,如果把它加入到Google Home智能音箱中,便可区分出不同用户发出的指令。
不过,这个模型需要配合视频才能更好地发挥作用,所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手,但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好,但经过一些细微调整,的确有可能成为强大的监听和监视工具。