AI见闻日报:将上下文学习能力从语言迁移到视觉,MetaVL开启下一个多模态时代 | 见智研究_天天播资讯
今日要点:
1、苹果在 iOS17 中加入transformer语言模型,用于提高文字和语音转文字时的准确性。
【资料图】
2、苹果开发人员:Vision Pro里用了“脑机接口”,通过检测眼睛等准确预测用户下一步要做什么
3、MetaVL: 将上下文学习能力从语言模型迁移到视觉,开启下一个多模态时代
4、Runway获得1亿美元D轮融资,谷歌领投
见闻视角
海外AI
1、苹果在ios17中加入transformer语言模型,用于提高文字和语音转文字时的准确性。
苹果在今日更新的ios系统介绍中,阐述了使用transformer语言模型,用于提高文字和语音转文字时的准确性,通过用于单词预测——提高了用户每次键入时的体验和准确性。而这个模型如同苹果一直以来强调对用户的隐私保护一样,是在手机端的模型。
见智研究认为,苹果使用transformer模型用于一些基础应用符合苹果一直以来的务实精神,苹果从不强调某项技术是否先进,而是要在用户体验上做到极致。这也是苹果一直强调技术落地到应用的体现。
见智研究相信苹果设备在明年将会拥有自己的llm模型,而这个模型按照苹果一贯的隐私保护模式,应为纯本地化的模型。
2、苹果开发人员:Vision Pro里用了“脑机”,通过检测眼睛准确预测用户下一步要做什么
一位在AR/VR领域工作十年、担任苹果AR神经技术研究员的网友Sterling Crispin发推文,介绍了苹果AR的神经技术研发
根据Crispin的介绍和苹果的专利说明,苹果的神经技术可以做到预测用户行为、根据用户状态调整虚拟环境。
最酷的结果是在用户实际点击之前预测他们会点击什么,人们的瞳孔在点击之前往往有反应,原因是人们会期望在点击之后会发生什么。
这时可以通过监测用户的眼睛行为来创造生物反馈,并实时重新设计用户界面,以创造更多预期的瞳孔反应。这是一个通过眼睛实现的粗略“脑机接口”,用户不用接受侵入性的脑部外科手术。
推断认知状态的其他技术,包括以用户可能无法察觉的方式向他们快速闪现视觉或声音,然后测量他们的反应。
见智研究认为,苹果通过全新的神经技术对人的行为进行预测,从而大幅减小了vision产品整个UI操作的延迟,大幅提升用户体验。从无数细节中可以看到,苹果在用搬山能力处理每一个细节,这个软硬整合能力,不是谁能可以随便模仿的,它所体现的每一个细节,都看出苹果花费巨大的功夫在解决交互体验。这也是苹果之所以伟大的地方。
3、MetaVL: 将上下文学习能力从语言模型迁移到视觉,开启下一个多模态时代
动机:研究如何在视觉-语言领域实现上下文学习,将单模态的元学习知识转移到多模态中,以提高大规模预训练视觉-语言(VL)模型的能力。方法:首先在自然语言处理(NLP)任务上元训练一个语言模型,实现上下文学习,然后通过连接一个视觉编码器将该模型转移到视觉-语言任务上,以实现跨模态的上下文学习能力的转移。优势:实验证明,跨模态的上下文学习能力可以转移,该模型显著提高了视觉-语言任务上的上下文学习能力,并且在模型大小方面能够有显著的优化,例如在VQA、OK-VQA和GQA上,所提出方法在参数数量减少约20倍的情况下超过了基准模型。见智研究一句话总结:
M Monajatipoor, L H Li, M Rouhsedaghat, L F. Yang, K Chang探索了将元学习的上下文学习能力从单模态迁移到多模态的可能性,证明了在视觉-语言任务中通过迁移可以显著提升上下文学习能力,甚至在模型大小方面实现优化。
这意味着多模态情况下的对话能力将得到加强,对于现有的文生图来说可能会带来新的变化,生成模式对用户将更友好。
4、Runway获得1亿美元D轮融资,谷歌领投
生成式AI平台Runway获得1亿美元D轮融资(约7亿元),估值15亿美元,本次由谷歌领投。谷歌投资Runway的最大原因之一是为了争夺云计算客户。
Runway曾在4月底与谷歌签订了7500万美元的3年商业协议,同时Runway已从谷歌获得了价值2000万美元的云计算资源用于产品运营和研发。
见智研究曾使用过GEN-1生成相应视频特效,但目前可玩性不算高。Gen-2是Runway在今年3月最新发布的,但目前手机客户端还未提供使用。Gen-2可以通过文本、图片、文本+图片直接生成视频,同时支持风格化和渲染添加好莱坞式大片特效,仅需要几分钟即可完成所有操作。
风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。-
AI见闻日报:将上下文学习能力从语言迁移到视觉,MetaVL开启下一个多模态时代 | 见智研究_天天播资讯
华尔街见闻 2023-06-06
-
抚州保理合同纠纷律师费用一般怎么计算 焦点报道
法师兄 2023-06-06
-
天天观速讯丨黄梅戏起源于什么地方_黄梅戏起源于哪个省
互联网 2023-06-06
-
maryse ouellet2008 环球新要闻
互联网 2023-06-06
-
大宗交易:中微公司成交2001.07万元,溢价3.39%(06-06)
东方财富Choice数据 2023-06-06
-
arctg计算器在线计算_arctg-当前看点
互联网 2023-06-06
-
快播:荷兰选择空客直升机H225M接替其美洲狮机队
中国航空新闻网 2023-06-06
-
绿色积分“共享购”打造新消费生态,最有前景的商业模式 看热讯
软件开发MrKim 2023-06-06
-
知名平台突然宣布:涨价!很多人每天都用_天天百事通
证券时报 2023-06-06
-
中国代表团出席世卫组织执委会第153届会议|环球短讯
亚汇网 2023-06-06
-
AI见闻日报:将上下文学习能力从语言迁移到视觉,MetaVL开启下一个多模态时代 | 见智研究_天天播资讯
华尔街见闻 2023-06-06
-
抚州保理合同纠纷律师费用一般怎么计算 焦点报道
法师兄 2023-06-06
-
天天观速讯丨黄梅戏起源于什么地方_黄梅戏起源于哪个省
互联网 2023-06-06
-
maryse ouellet2008 环球新要闻
互联网 2023-06-06
-
大宗交易:中微公司成交2001.07万元,溢价3.39%(06-06)
东方财富Choice数据 2023-06-06
-
arctg计算器在线计算_arctg-当前看点
互联网 2023-06-06
-
快播:荷兰选择空客直升机H225M接替其美洲狮机队
中国航空新闻网 2023-06-06
-
绿色积分“共享购”打造新消费生态,最有前景的商业模式 看热讯
软件开发MrKim 2023-06-06
-
知名平台突然宣布:涨价!很多人每天都用_天天百事通
证券时报 2023-06-06
-
中国代表团出席世卫组织执委会第153届会议|环球短讯
亚汇网 2023-06-06
-
如何提高粮食产量?这里的种养循环有方法
环球网 2023-06-06
-
国家自然博物馆正式揭牌
中工网 2023-06-06
-
资讯推荐:暖人心 聚人心
青海羚网 2023-06-06
-
瑞幸门店达万家 成为全国首家“万店”连锁咖啡品牌
深圳商报 2023-06-06
-
助力区域产业创新发展,桃浦这里的“酒店+公寓”新组合“留人又留心”
新闻晨报 2023-06-06
-
环球聚焦:无女主修仙小说推荐高质量_无女主修仙小说推荐
互联网 2023-06-06
-
5月销量14,300台 比亚迪海鸥首月成绩发布 世界时快讯
搜狐科技 2023-06-06
-
外在表现力强 车厢精致度提升 动力更充沛 风行T5 EVO狂飚版试驾测评 当前关注
懂车帝 2023-06-06
-
武汉城市学院有专科吗_武汉城市学院
互联网 2023-06-06
-
即时看!CAD 2014安装包+安装教程
哔哩哔哩 2023-06-06
-
招商蛇口3笔公司债将付息 涉及本金额61.6亿元
观点地产网 2023-06-06
-
世界最资讯丨汇成基金:上周共有22只基金成立 合计募资253.33亿元
券中社 2023-06-06
-
每日精选:魔兽世界侏儒坐骑在哪买?_魔兽世界侏儒坐骑在哪买
互联网 2023-06-06
-
30万梅西敬酒?平安北京:被骗了警察叔叔敬你一杯 当前播报
游民星空 2023-06-05
-
当前时讯:扫描仪是什么设备_绘图仪是输入设备还是输出设备
科学教育网 2023-06-05
-
银行理财子另起炉灶,直销APP能否打破代销依赖? 环球最资讯
第一财经资讯 2023-06-05
-
当前热文:新开普已参与阿里“通义千问”测试
中国网财经 2023-06-05
-
日本明治维新的时间是在哪一年?地点是追溯到什么时间?
趣历史网 2023-06-05
-
关于选定新乡市新正街、东卓路城市道路工程可行性研究报告编制单位的通知-全球快看点
河南大小事儿 2023-06-05
-
财政部相关负责人:整体来看我国财政状况健康安全
看看新闻Knews 2023-06-05