解决方案

与OpenAI协作13天后Figure人形机器人展现与人类对话才能

发布时间:2024-03-15 1 次浏览

  视频中,Figure AI人形机器人具有视觉才能并能表述所见画面,它伸手拿起桌上的苹果,并解说了这么做的原因,人类的发问后,这台人形机器人“思索”2~3秒后便能顺利作答,手部动作速度则挨近人类。据视频介绍,机器人采用了端到端神经网络,且视频并未加速。

  Figure AI创始人Brett Adcock和AI团队负责人Corey Lynch在社会化媒体上解说,该人形机器人由OpenAI供给了视觉推理和言语了解,Figure AI的神经网络则供给快速、灵活的机器人动作。人形机器人将摄像机的图画输入和麦克风接纳的语音文字输入OpenAI供给的视觉言语大模型(VLM)中,该模型能够了解图画和文字。Figure机载相机以10hz的频率拍照画面,随后神经网络以200hz的频率输出24个自由度动作。画面中的人形机器人不依赖长途操作,行为都是学习而得的。两周前,Figure AI才宣告与OpenAI协作,以打破机器人学习的边界,这一个视频是协作13天的效果,两边正在为人形机器人研制下一代AI模型。

  “机器人的速度有了明显进步,咱们开端挨近人类的速度。“Brett Adcock表明。

  Figure AI成立于2022年,已开发一款名为Figure 01的通用机器人,完结最新6.75亿美元融资后,估值到达约26亿美元左右。比照本年2月发布的一条视频,其机器人进行的是双腿行走、拿起塑料箱的使命,最新视频展现的新技能则是与人类对话的才能。

  人形机器人发展已在加速。上一年年底,特斯拉发布了第二代人形机器人Optimus Gen2的产品展现,该人形机器人搭载了AI大模型,可拿起鸡蛋。本年1月发布的视频中,特斯拉人形机器人能折叠衣服。言语对话上,英国公司Engineered Arts人形机器人Ameca不久前与人类对话的视频也曾引发重视,该机器人具有视觉才能,能够描绘空间特征,例如窗户开着、光线太亮,眼球和嘴巴都会动,表情传神。

  OpenAI也借着与Figure AI的协作展现了大模型使用至人形机器人方面的才能。在趋于剧烈的商场之间的竞赛中,OpenAI已在加速迭代。

  本年3月,被视为OpenAI最强竞赛对手的Anthropic发布其最新大模型系列Claude 3,其间Claude 3 Opus在多项基准中得分均超GPT-4和Gemini 1.0 Ultra。彼时有AI业内人士告知榜首财经记者,在OpenAI站在榜首队伍、Anthropic等站在第二队伍的层层向下“镇压链”中,Anthropic最新产品推出可能会打乱OpenAI的节奏,更早推出GPT-5。近来记者从大模型从业者了解到,实际使用中Claude 3在某些使命下的体现较好,可胜过GPT-4。

  OpenAI确乎更期望稳住本身位置。除了与Figure AI协作外,美国当地时间周三,OpenAI CTO Mira Murati(米拉·穆拉迪)还泄漏,文生视频模型Sora或将于本年底发布,OpenAI正在经过红队测验保证Sora的安全和可靠性。昨日则有音讯称,网友发现在必应等搜索引擎可搜到GPT-4.5 Turbo产品页面,页面摘要显现GPT-4.5 Turbo在速度、准确性和可扩展性上逾越GPT-4 Turbo,支撑25.6万tokens的上下文窗口,但很快相关链接就下架了,这或许意味着OpenAI将加速推出大模型新版本。


  • 在线客服
  • 联系电话
    181-1877-6570
  • 二维码

    扫一扫
    加好友