阿里云宣布,旗下大模型“通义千问”开启企业邀请测试,测试官网也已经上线。根据官网的介绍,阿里云把它定义为一款专门响应人类指令的大模型,是效率助手,也是点子生成机。阿里达摩院在NLP自然语言处理等前沿科研领域早已布局多年,并于2019年启动大模型研发。此前有消息称,阿里巴巴将于4月11日推出大模型,18日推出行业应用类模型。
“有意见”留言板
@TOFU:最近AI产品的waitlist越来越多了,都要排不过来了!这要是实体的都得雇人排队了吧?等得好难受。这次的通义千问,看到网上已经有人试过,似乎训练数据比OpenAI的要新一点,以日后的实际应用来看,这点差异应该可以忽略不计了吧。
@老董:技术突破后的破窗效应开始逐渐显现出来了,如今的大模型技术已经获得了广泛认可,自然会有更多技术厂商加入赛道,共同进行推进,在这期间也会产生更多大模型应用方向。所以与其关心大模型是不是会取代人类,还不如好好研究大模型在未来如何能更好的为人们服务。
@取个啥名字:阿里云AI大模型取名为“通义千问”,和百度的“文心一言”形成了对仗,有点儿一唱一和的意思,或许还隐藏着另外一种含义:“国产GPT”不是谁的独角戏。不知道腾讯的产品会取个啥名字。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
伊尔德兹技术大学团队通过词典手术和离线蒸馏,以不足20美元成本打造出专为土耳其语优化的200M参数句子嵌入模型,在语义相似度任务上超越了参数量更大的原版教师模型。