你能想象在不久的将来,你在网上冲浪时候看到的视频博主制作的视频,或者是大学老师录制好的网课,是由机器人帮忙拍出来的吗?

现如今,视频网站的流量已经十分庞大,很多年轻人或者是权威专家们都会开设一些视频网站的账号,成为一个视频博主,但并不是所有的博主都有一个专业的摄影团队,而将手机固定在支架上拍摄又往往无法将内容很好地呈现在视频里,如果可以有个“人”随时可以充当摄影师,对创作者而言是个天大的好消息,如今,一款机器人正肩负着这样的使命。

这是一款被称为“观星者”的交互式机器人,它可以识别使用者给他下达的指令,通过机器人的手臂完成相应的拍摄动作,它的出现让一些没有办法请摄影团队的视频创作者们能在机器人的帮助下拍摄更多动态视频。

研究人员们首先在机器人的手臂上安装了一个摄像头,这个可以自主活动的机械臂带有七个独立的电机,可以自由选定跟踪区域或者自主跟踪视频对象进行移动,同时该机器人可以根据使用者的一些明示或者暗示进行细微调整,例如传感器可以检测并分析使用者的身体语言、手势等。

据悉,该机器人还连通了ChatGPT-3,用户的指令由无线线麦克风录制,并发送到语音识别软件 Microsoft Azure Speech-to-Text,转录的文本会连同自定义提示一起被发送到 GPT-3程序上,从而理解用户希望相机执行怎样的动作,如使用高角度拍摄或者是更紧凑的取景。

目前,该机器人主要的测试项目是老师们用于教学视频的录制,为了不干扰正常的教学,老师们用来吸引观众注意力的语句可以作为机器人的指令语句。

例如:当老师说“请注意我左手手上的物品”后,机器人可以捕捉到相关指令,并指挥机械手臂配合摄像头聚焦在老师的手上,促使相机四处平移;当老师说“请大家仔细观察我是如何把物品从A处移动到B处”时,机器人可以马上做出判断,通过提高拍摄角度,让观众拥有更好的视野观看整个移动过程。

据研发人员透露,现阶段的迭代中,团队希望提高机器人的交互能力,提高识别使用者发出指令的准确性,避免教师与学生或听众交谈时被误识别为对机器人的指令,只有尽量解决词汇干扰的问题,才可以让该机器人更适合教学录制。

除此之外,研发团队还希望将这一项技术应用在更多的设备上,如无人机或者轮式机器人,以达到最大化地利用机器人帮助视频创作者们构建自己的摄影团队。

虽然“观星者”机器人可以为普通的视频创作者们提供一个搭建摄影团队的可能性,但这个机器人是依赖于一套昂贵的机械臂以及众多的传感器组成的,使用成本相对比较高,目前可能不是普通的视频创作者们容易负担的消费。

多伦多大学计算机科学博士李建南是该项目的首席研究员,他认为“观星者”的概念不一定会受到昂贵的成本限制,而恰恰是机器人拍摄是一个空白的且前景广阔的市场,以后会吸引更多的消费者选择,因为他认为这仍然是组建一个摄影团队的最低成本的方式。

作者 admin