—— 青亭网

分享
原创 2021-11-18

Esther|编辑
在大多数人印象中,AR眼镜的主要特征是提供虚实融合的视觉辅助效果。实际上,与同样基于虚拟技术的VR相比,AR不仅仅能够看到真实环境,它的应用场景和VR也不同,因为它可以通过一系列智慧的功能来辅助日常生活、工作和学习。

此前Facebook就曾提出,AR眼镜将采用支持场景感知的AI算法,推算使用者在场景中需要获取的信息,以及需要执行的下一步动作,接着使用者可以用EMG腕带来进行确认。的确,穿戴式AR眼镜与智能AI助手结合是必然的结果,市面上大多数非AR的智能眼镜已经配备语音助手,相比之下AR眼镜需要的不只是语音助手,它应该可以通过摄像头来提供智能的视觉辅助,就像是科幻电影描述的那样。

近年来,计算机视觉技术已经得到长足发展,相关算法可以识别不同类型的物体,或是用于手势识别、人脸识别等场景。不过,目前计算机视觉算法面临的最大难题是,它主要是基于第三人称视角的照片和视频训练的,因此AI相当于以旁观者的角度去识别周围环境和活动,如果将它应用于家用机器人或AR眼镜,则需要识别第一人称图像,这对基于第三人称数据训练的AI并不友好。

为了解决上述问题,Meta近期开源了市面上最大的第一人称视频数据集Ego4D,视频时长累计3205小时,号称是其他同类数据集规模的20多倍。据悉,该数据集是Meta与全球13所大学合作的成果,共耗时2年时间完成。另外,Ego4D数据基于室内和室外场景,来源也分布在世界多个国家,比如:自沙特阿拉伯、东京、洛杉矶和哥伦比亚等等。
为何收集第一人称视频
收集了这么多第一人称视角的视频,它和第三人称视频有什么区别呢?简单来讲,就像是在过山车上看景色,和从地面看过山车之间的区别。

人的大脑可以轻易将第一人称和第三人称视角联系起来,而现有的AI技术不支持这样灵活的分析能力,因此如果让计算机视觉算法理解过山车上的景色,它可能并不能看懂,因为训练算法的数据一般是地面上拍摄的第三人称视频。

AI科研人员Kristen Grauman表示:为了让AI像人一样与周围的环境交互,它需要具备第一人称感知能力,像人眼一样感知实时运动、交互和多感官视觉。
而和许多视频数据不同,Ego4D视频通过头戴摄像头来拍摄,因此可以模拟第一人称视角,而且它们是一系列动态的活动,而不只是一张一张图片。因此,Ego4D的出现有望为第一人称计算机视觉打开新的场景,用于穿戴式摄像头、家用机器人助手等设备,这些设备将通过第一人称摄像头来理解周围的环境。

Ego4D数据收集参与者的职业
牛津大学教授Andrew Zisserman表示:在未来几年,Ego4D数据集有望成为计算机视觉发展的驱动力,它会帮助计算机视觉算法以第一人称理解事件和活动,分析时间背景等。
为AR眼镜公开采集数据
值得注意的是,利用图像、语音数据来分析用户周边环境,可能会带来严重的隐私争议,尤其是Meta推出的Stories拍照眼镜,很可能会被看作是移动的监控。

Ego4D视频数据包含的活动内容
Meta明确指出,这些数据是由合作学校的855人录制的,他们并非Meta员工,使用的设备则是GoPro和拍照眼镜。
而为了获得大家的信任,Meta多次公开视频数据采集的详细信息和进度,在Meta公布的网站中,你可以直接查看Ego4D包含的视频数据,这些信息都是公开的。

Meta还透露:Ego4D录制的视频来自于未经编排的日常活动,包括施工、购物、玩游戏、烘焙、撸猫/狗、社交等等。通过面部打码等方法,去除可识别的身份等信息后,大学才将这些视频数据提供给Meta。视频内容涉及环境、人手动作,以及和一百种不同的物品交互。除此之外,FRL科研人员也利用Vuzix Blade AR眼镜,在预先设定的实验室场景中,收集了额外400小时的第一人称视频数据。
科技创新依赖新工具
Meta表示:旧的工具无法开发未来的科技创新。因此,AR眼镜的智能AI系统也需要全新的训练数据。据Meta设想,Ego4D训练的AI算法将具备以下功能:
(作为AI训练的基准,这些功能或应用场景也是Ego4D的一部分,Meta希望通过开源数据集和训练基准,将技术研发开放给世界各地的科研人员,鼓励更多人用Ego4D数据来训练AI系统)
Meta科研人员指出,Ego4D将具备情景记忆,以及视觉和听觉记录功能。其中,情景记忆指的是可以记住发生在特定时间和地点的事件,能够回答“钥匙放在哪了”等问题。此外,AR眼镜将教你学习打鼓、做菜、找钥匙,或是用全息图像来显示过去的记忆。比如指导IKEA家具安装,或是提示做饭步骤,如果已经放盐,系统会提醒你避免重复加盐。

而为了实现上述场景,Meta需要训练足够智能的AI系统,像人一样以第一人称理解世界,与世界互动,这种形式也被科研领域称为自我为中心的感知。

目前,Ego4D AI系统还不能达到理想的效果,因此它只是一个科研项目,并不是正在开发中的产品。不过,很可能会在未来的AR眼镜中应用这样的技术。Meta AI科研人员Kristen Grauman表示:Ego4D等AI算法有望通过AR眼镜,解锁更多潜在场景,甚至将AR与VR融合。

当被问及隐私安全问题时,Meta表示:Ego4D预计将进一步引入隐私保护措施,例如:AR眼镜在增强音频之前,可以先征求用户许可,或者限制音频采集的范围,仅识别用户与其他人的对话,或用户附近的声音。
( END)

* 文章为作者独立观点,不代表数艺网立场转载须知
广告 欺诈 淫秽 色情 侵权 骚扰、辱骂、歧视 敏感 违法 犯罪 反动、政治 其它
数艺网是一个信息获取、分享及传播的平台,我们尊重和鼓励数艺网用户创作的内容,认识到保护知识产权对数艺网生存与发展的重要性,承诺将保护知识产权作为数艺网运营的基本原则之一。
本条款原则如下:
1. 用户在数艺网上发表的全部原创内容(包括但不仅限于文章、案例/项目和评论),著作权均归用户本人所有。用户可授权第三方以任何方式使用,不需要得到数艺网的同意。
2. 数艺网上可由多人参与编辑的内容,包括但不限于案例/作品的认领、企业/机构的认领,所有参与编辑者均同意,相关知识产权归数艺网所有。
3. 数艺网提供的网络服务中包含的标识、版面设计、排版方式、文本、图片、图形等均受著作权、商标权及其它法律保护,未经相关权利人(含数艺网及其他原始权利人)同意,上述内容均不得在任何平台被直接或间接发布、使用、出于发布或使用目的的改写或再发行,或被用于其他任何商业目的。
4. 为了促进知识的分享和传播,用户将其在数艺网上发表的全部内容,授予数艺网免费的、不可撤销的、非独家使用许可,数艺网有权将该内容用于数艺网各种形态的产品和服务上,包括但不限于网站以及发表的应用或其他互联网产品。
5. 第三方若出于非商业目的,将用户在数艺网上发表的内容转载在数艺网之外的地方,应当在作品的正文开头的显著位置注明原作者姓名(或原作者在数艺网上使用的帐号名称),给出原始链接,注明「发表于数艺网」,并不得对作品进行修改演绎。若需要对作品进行修改,或用于商业目的,第三方应当联系用户获得单独授权,按照用户规定的方式使用该内容。
6. 数艺网为用户提供「保留所有权利,禁止转载」的选项。除非获得原作者的单独授权,任何第三方不得转载标注了「禁止转载」的内容,否则均视为侵权。
7. 在数艺网上传或发表的内容,用户应保证其为著作权人或已取得合法授权,并且该内容不会侵犯任何第三方的合法权益。如果第三方提出关于著作权的异议,数艺网有权根据实际情况删除相关的内容,且有权追究用户的法律责任。给数艺网或任何第三方造成损失的,用户应负责全额赔偿。
8. 如果任何第三方侵犯了数艺网用户相关的权利,用户同意授权数艺网或其指定的代理人代表数艺网自身或用户对该第三方提出警告、投诉、发起行政执法、诉讼、进行上诉,或谈判和解,并且用户同意在数艺网认为必要的情况下参与共同维权。
9. 数艺网有权但无义务对用户发布的内容进行审核,有权根据相关证据结合《侵权责任法》、《信息网络传播权保护条例》等法律法规及数艺网社区管理规定对侵权信息进行处理。
侵权举报
1.处理原则
数艺网作为新媒体艺术领域的分享交流平台,高度重视自由表达和个人、机构正当权利的平衡。依照法律规定删除违法信息是数艺网社区的法定义务,数艺网社区亦未与任何中介机构合作开展此项业务。
2.受理范围
受理数艺网社区内侵犯机构或个人合法权益的侵权举报,包括但不限于涉及个人隐私、造谣与诽谤、商业侵权。
a.涉及个人隐私:发布内容中直接涉及身份信息,如个人姓名、家庭住址、身份证号码、工作单位、私人电话等详细个人隐私;
b.造谣、诽谤:发布内容中指名道姓(包括自然人和机构)的直接谩骂、侮辱、虚构中伤、恶意诽谤等;
c.商业侵权:泄露机构商业机密及其他根据保密协议不能公开讨论的内容。
3.举报条件
用户在数艺网发表的内容仅表明其个人的立场和观点,并不代表数艺网的立场或观点。如果个人或机构发现数艺网上存在侵犯自身合法权益的内容,可以先尝试与作者取得联系,通过沟通协商解决问题。如您无法联系到作者,或无法通过与作者沟通解决问题,您可通过点击内容下方的举报按钮来向数艺网平台进行投诉。为了保证问题能够及时有效地处理,请务必提交真实有效、完整清晰的材料,否则投诉将无法受理。您需要向数艺网提供的投诉材料包括:
a. 权利人对涉嫌侵权内容拥有商标权、著作权和/或其他依法可以行使权利的权属证明,权属证明通常是营业执照或组织机构代码证;
b. 完整填写的通知书;附供下载的:侵权投诉通知书;
c. 举报人的身份证明,身份证明可以是身份证或护照;
d. 如果举报人非权利人,请举报人提供代表权利人进行举报的书面授权证明。
e. 为确保投诉材料的真实性,在侵权举报中,您还需要签署以下法律声明:
(1) 我本人为所举报内容的合法权利人;
(2) 我举报的发布在数艺网社区中的内容侵犯了本人相应的合法权益;
(3) 如果本侵权举报内容不完全属实,本人将承担由此产生的一切法律责任,并承担和赔偿数艺网因根据投诉人的通知书对相关帐号的处理而造成的任何损失,包括但不限于知乎因向被投诉方赔偿而产生的损失及数艺网名誉、商誉损害等。
4.处理流程
出于网络平台的监督属性,并非所有申请都必须受理。数艺网自收到举报的七个工作日内处理完毕并给出回复。处理期间,不提供任何电话、邮件及其他方式的查询服务。 出现数艺网已经删除或处理的内容,但是百度、谷歌等搜索引擎依然可以搜索到的现象,是因为百度、谷歌等搜索引擎自带缓存,此类问题数艺网无权也无法处理,因此相关申请不予受理。您可以自行联系搜索引擎服务商进行处理。 此为数艺网社区唯一的官方侵权投诉渠道,暂不提供其他方式处理此业务。 用户在数艺网中的商业行为引发的法律纠纷,由交易双方自行处理,与数艺网无关。
免责申明
1.数艺网不能对用户发表的回答或评论的正确性进行保证。
2.用户在数艺网发表的内容仅表明其个人的立场和观点,并不代表数艺网的立场或观点。作为内容的发表者,需自行对所发表内容负责,因所发表内容引发的一切纠纷,由该内容的发表者承担全部法律及连带责任。数艺网不承担任何法律及连带责任。
3.数艺网不保证网络服务一定能满足用户的要求,也不保证网络服务不会中断,对网络服务的及时性、安全性、准确性也都不作保证。
4.对于因不可抗力或数艺网不能控制的原因造成的网络服务中断或其它缺陷,数艺网不承担任何责任,但将尽力减少因此而给用户造成的损失和影响。
协议修改
1.根据互联网的发展和有关法律、法规及规范性文件的变化,或者因业务发展需要,数艺网有权对本协议的条款作出修改或变更,一旦本协议的内容发生变动,数艺网将会直接在数艺网网站上公布修改之后的协议内容,该公布行为视为数艺网已经通知用户修改内容。数艺网也可采用电子邮件或私信的传送方式,提示用户协议条款的修改、服务变更、或其它重要事项。
2.如果不同意数艺网对本协议相关条款所做的修改,用户有权并应当停止使用数艺网。如果用户继续使用数艺网,则视为用户接受数艺网对本协议相关条款所做的修改。
阅读并同意此认领协议方可认领案例
*认领案例的操作记录无法自行删除,请务必确保您参与该案例身份的真实性