首页 移动应用 IOS

Siri变得更聪明以后 苹果如何保护你的隐私

在几乎所有苹果用户的印象中,Siri 就是一个纯粹的语音助手。你对着它说话,问一些问题,它就给你一些回馈。因为对着手机说话太羞耻,很多事情好像还不如自己直接动手来得迅速,很长一段时间内它都备受冷落。

不过这种现状很快就有改变的希望了,最明显的例子就是即将到来的新系统 watchOS 4。当你迎来新的一天时,看一下 Apple Watch,它会给你带来你可能最需要的信息,比如天气、交通状况、预定事项等等。这些都不是系统的随机显示,而是它认为那是你当时最需要的。这个极具个性化的功能,其背后就是 Siri 在主导。

没错,Siri 很快就不再只是一个单纯的语音助手了。苹果的软件工程高级副总裁克雷格·费德里吉不久前通过电子邮件向媒体表示,Siri“不再只是一个语音助手……它基于本地的智能功能可以为我们的设备带来各种日常的互动。”他说,苹果的团队“正在努力将它变成我们所有平台的核心部分”。

前阵子费德里吉从内容服务主管艾迪·库伊手中接过 Siri 的业务,这代表着它和操作系统更深层次的融合即将开始。我们从 watchOS 4 的 Siri 表盘上就能够很直观地感受到这一点。“随着今年秋季软件更新的到来,用户们能够体验到更多的 Siri 功能,而在往后的几年里它还会更多地整合到我们所有平台的核心用户体验中。”费德里吉预告说。

通过 AI 技术让设备变得更个性化这件事,其实不只是苹果,只要是大厂就都在做的。和苹果不同的是,其他公司会更倾向于采用各种各样的数据,让 AI 去学习。尽管这会引发人们对隐私被侵犯的担忧和批评,但那毕竟会让设备和服务变得更好用。与此相对的,苹果受到自己对隐私的承诺的束缚,不可能这样明目张胆地使用数据。这让它受到质疑,认为 Siri 的体验会因此大打折扣。

苹果的解释

面对人们的质疑,苹果产品营销高级副总裁格雷格·乔思维亚克的回答非常干脆:“这种说法是不对的。事实是我们会一直对数据进行尽可能的优化,我认为这是许多用户都心知肚明的,他们知道我们对隐私的态度或许和其他人不一样。”

“我们能够带来非常个性化的体验……而且还不会将每一个用户都当成产品,去追踪他们的信息,然后卖一个最好的价钱。我们不是这么做生意的。”乔思维亚克很自信地承诺说。

其实就让 AI 去学习这一点上,苹果和它的竞争对手们并没有很大的不同,都是要采集用户输入的或说出来的内容,然后进行机器学习的处理。不过有趣的是,这些个人信息里大部分的东西,其处理都是在设备本地上的,不会给苹果在内的任何外人看到。

即使这些学习过程不可避免要涉及到云网络,过程也是尽可能保证完全的。当你对着 Siri 说话的时候,iPhone 会自动将任何和用户 ID 有关的信息去除,然后给它重新分配一个随机请求 ID。这些信息随后经过加密,被发送到云端进行进一步的语音识别,最后通过自然语言处理来理解整句话的意思。

比如在手机的照片库里寻找指定照片这样的命令,就是完全在本地进行的。iPad 和 iPhone 从 iOS 10 开始就能够运用机器学习对用户的照片进行分类。特别是你要搜索某某人的照片时,那就是设备软件自己的面部识别计算了。“你的设备性能相当强大,而且每一代都比过去更加强大。”乔思维亚克说,“因为我们专注于隐私保护,我们就要完全利用这些机能,比如设备本地的机器学习,这将打造了不起的体验,还不需要牺牲你的数据。”

在你不知道的时候,设备中的 AI 模型会学习你操作设备的方式,输入的内容,摄像头见到的东西,麦克风听到的声音,以及传感器感知到的各种信息。这些数据其实并不大,仅有 200MB 这样,但信息量却非常多。Siri 可以利用这些数据,判断是否提供必要的辅助。

在这一点上,苹果对自家硬件和软件的控制力确实发挥了相当的作用。苹果设备的图形芯片和其他辅助芯片都能够承担运算任务,这让机器学习的本地实现成为了可能。苹果的工程师们花费了大量时间在让机器学习软件和设备的处理器、传感器更好配合上。有传闻称,苹果甚至还要开发专门的 AI 芯片来处理这类任务。

云端上呢?

当然正如刚才所说的那样,光是本地处理还是不够的,Siri 要变得真正强大,还是需要云网络的帮忙。不过很多时候,苹果都会选择第三方数据,比如图片来帮助训练 Siri,让它学会分辨。甚至于苹果在一篇科技博文里还透露,它采用了足可乱真的合成图片,从而满足 AI 训练所需要的庞大数据量。

即使是那些必须从用户那里提取的数据,比如说用户发送去的语句听写,苹果也做到去除上面带有的任何用户信息,使得即使是它自己也不知道那些录音是来自于谁的。这是苹果实现的技术中最有趣的一点 —— Siri 能够学习用户,哪怕它并不知道哪个用户是谁。

Siri 每个月都在被 3.75 亿人所使用,而苹果拥有着足足六个月分量的录音来训练它。为了让 Siri 更智能,苹果甚至建立了一个专门的模型,对应那些将英语作为第二语言的用户。六个月后,新一批录音被储存。其他内容包含了音乐、体育、商务等各种各样范畴的音频也同样被用于训练 Siri。

这些庞杂的数据可以让 Siri 为你推荐各种各样的信息,watchOS 4 里的 Siri 表盘就是最好的例子。但与此同时,苹果服务器上训练用的数据却不包括那么多的信息。云端上的模型只会去学习它能够得到的信息。

个性化和隐私,很多人都曾认为那是很难兼顾的,但苹果通过这一系列手段,找到了一个平衡点。在保护用户隐私的同时,尝试带来足够好的个性化体验。当然了,人们对苹果“两头不靠”的批评肯定还会继续,好在 iOS 11 即将到来,新的 Siri 或许能够交出一份令人满意的答卷。

官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

↑扫描二维码

想在手机上看科技资讯和科技八卦吗?

想第一时间看独家爆料和深度报道吗?

请关注TechWeb官方微信公众帐号:

1.用手机扫左侧二维码;

2.在添加朋友里,搜索关注TechWeb。

手机游戏更多