在2018年初,Facebook的人工智能研究人员推出了一种深度学习系统,可以将人们的2D照片和视频图像转换为运动中人体的3D网格模型。上个月,Facebook公开分享了其“DensePose”技术的代码,该技术可以被好莱坞电影制作人和增强现实游戏开发者使用 - 但也可能是那些寻求建立状态的人。
DensePose超越了基本的物体识别。除了在图片中检测人类外,它还可以通过估计躯干和肢体的来制作他们身体的3D模型。 然后,这些模型可以使该技术在2D视频中创建人体运动的实时3D重建。例如,它可以制作视频,显示几个人踢足球或骑摩托车的单个人的模型。
根据Facebook AI研究(FAIR) 2018年1月发表的论文,这项工作可能对“图形,增强现实或人机交互有用,也可能成为普通3D对象理解的踏脚石” 。
但是,这项研究的“令人不安的影响”可以实现“实时”,非营利性人工智能研究公司OpenAI的战略和主管杰克克拉克在其热门的通讯中称为进口人工智能。Clark首先在2月份的通讯中讨论了Facebook的DensePose论文的含义,并在Facebook 在软件开发平台GitHub 上发布DensePose代码后于6月进行了跟进。
“同一系统在体系结构中具有广泛的实用性,可能让运营商分析大群人如果他们的运动有问题就可以解决 - 例如,如果某种村欲情史运动组合,这样的系统可以用来向另一个系统发信号被自动标记为预示或骚乱,“克拉克在他的通讯中写道。
与往常一样,DensePose背后的深度学习算法在一开始就需要人类的帮助。Facebook研究人员首先邀请人类注释者通过手动标记50,000张人体图像上的某些点来创建训练数据集。为了使注释者更容易完成这项工作,并试图提高他们的准确性,研究人员打破了标记为头部,躯干,四肢,手和脚等身体部分的任务。他们还“展开”每个身体部位以呈现多个视点,而无需注释器手动旋转图像以获得更好的视图。
仍然,仅要求注释者为每个图像标记100到150个点。为了完成训练数据,Facebook研究人员使用一种算法来估计和填充2D图像和3D网格模型之间相应的其余点。
结果是一个系统可以执行2D到3D转换,速率为“240×320图像每秒20-26帧,800×1100图像每秒4-5帧”,Facebook研究人员写道纸。换句线D视频中实时创建人体的3D模型。
Facebook的研究人员没有特别提到作为DensePose的可能应用,以及他们在论文中列出的许多内容。但由于Facebook已将其技术放在那里,如果他们愿意,有人可以将DensePose用于或执法。
事实上,其他研究小组一直在研究类似的系统来估计人体安全应用的姿势:一群英国和印度的研究人员一直在开发一种无人机系统,旨在探测人群中的行为。显然,世界各地的执法机构和都有兴趣利用这种技术,无论是好还是坏。
克拉克描述了他希望看到FAIR小组和人工智能研究人员公开讨论他们工作的影响的希望。他想知道Facebook的研究人员是否考虑了的可能性以及Facebook是否有内部流程来衡量公开发布此类技术的风险。在DensePose的情况下,这是一个只有Facebook可以回答的问题。该公司没有回复评论请求。
“作为一个社区,我们 - 包括像OpenAI这样的组织- 需要更好地公开处理发布功能越来越强大的系统的信息危害,以免我们界上支持我们不负责任的事情。
免责声明:本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果,请及时通知我们,本网站将在第一时间及时删除。
ElCorteInglés因价格错误取消购买PlayStation 4和PlayStation VR
本文由来源于财鼎国际(www.hengpunai.cn)