登录路演时代
忘记密码
忘记密码
忘记密码
欢迎注册路演时代
已有账号?马上登陆
西部郑宏达 阿里千问高阶内测测评
发布来源: 路演时代 时间: 2026-01-20 11:02:43 0

1、阿里千问基础功能演示

闪购功能深度整合:阿里千问本次版本更新上线AI生活助理,点外卖功能与淘宝闪购深度整合,用户一句指令即可触发操作,除查看骑手具体地图定位外,点单到付款全流程无需跳转APP。千问可基于授权定位匹配当前位置,支持修改收货地址,例如发送“帮我点份早餐,我想吃包子、喝豆浆”指令,会自动推荐公司附近的包子馒头套餐,但目前仅能以套餐形式推荐商品,无法单独推荐同一家店铺的两种商品。此外,通过千问渠道使用闪购点外卖可享15元红包补贴,骑手位置可通过文字指令查询预计送达时间,查看具体定位需进入订单详情跳转至淘宝APP,该功能尚未完全嵌入千问。

高德功能场景应用:阿里千问2025年12月底集成高德地图功能,支持基础导航操作,用户发送导航指令后,千问会调用高德服务生成小卡片,展示各交通方式耗时,点击箭头即可跳转至高德APP开始导航,该功能为AI生活助理基础能力,豆包、美团小美等APP也已实现。在复杂指令处理上,千问表现更具优势,例如发送“明天要出去玩,先导航,再规划路线,还要推荐咖啡厅”指令,豆包仅能提供文字导航,推荐的咖啡厅跳转至抖音本地生活页面;千问则会调用高德地图生成小卡片,自动将出发时间设为第二天上午,联动高德与小街榜推荐咖啡厅,还能响应“推荐附近停车场”需求,给出5个停车场选项并说明收费差异。此外,千问还能识别模糊需求,例如“周末想去打网球”“想练瑜伽”,可直接推荐对应场馆。

飞猪功能集成测试:阿里千问与飞猪已实现集成,支持机票、酒店预订及行程规划功能。用户发送“春节期间2月17号去长白山,22号回,提供合适的机票方案”指令后,千问会调用飞猪信息筛选出3套满足全程直飞、出发时间适中、性价比高的方案,展示基本信息,点击订票按钮可查看详情,但购票操作需跳转至飞猪APP完成。后续发送“预定7天酒店”指令,千问会结合飞猪给出3套方案,自动将入住时间设为2月17日,点击订酒店同样需跳转飞猪APP。若要求“做整体行程方案及餐厅推荐”,千问会同时调用飞猪与高德的API,生成包含每日行程、餐厅推荐及出行小贴士的完善旅游方案,当前整合流畅度较好,但核心预订操作仍需跳转至飞猪APP完成,无法像闪购一样实现全流程在千问内操作。

支付宝政务功能整合:阿里千问与支付宝集成了50个常用政务场景功能,用户一句指令即可调用支付宝服务,实现一键跳转,无需手动打开支付宝再查找对应入口。例如发送“身份证丢了如何补办”“帮我查一下社保”“租房子要提取公积金”等指令,千问会生成对应服务的小卡片,点击即可直接跳转至支付宝随身办的对应页面,大幅节省操作时间。不过该功能目前仅实现跳转服务,后续的信息填写、业务办理等操作仍需在支付宝内完成,尚未实现全流程在千问内的操作。

AI购物功能测试情况:阿里千问的AI购物功能目前处于测试阶段,尚未正式纳入版本更新,仅为雏形状态。例如发送“帮父母选一款3000元、适合有猫家庭的扫地机器人”指令,千问会推荐两款产品并附带商品卡片,点击可跳转至天猫淘宝的商品详情页面,查看及购买操作需在淘宝内完成。但该功能调用稳定性不足,如发送“推荐500元保温杯”指令,可能仅提供文字版推荐,无商品链接。发布会演示案例中,发送“下周去四姑娘山徒步,帮我看看天气以及装备”指令,千问可联动提供天气信息、徒步清单,并推荐凯乐石、迪卡侬等品牌的鞋子、冲锋衣等装备,附带商品卡片,但更换徒步地点后,可能仅能获得文字回复。


2、高阶任务助理B端功能测评

咨询调研功能测试:当前正在内测的任务助理为贝塔版,入口位于界面左下角雪花形状标志处,是一款端到端、输出内容更丰富的agent,涵盖咨询调研(撰写报告)、办公(制作图表、撰写PPT)、应用开发(小程序及网页开发)三类偏B端功能,以及结合阿里生态的C端生活办事场景。对其咨询调研功能进行测试,布置梳理国内外大模型进展、相关公司产品情况及商业化进展的任务,该任务耗时14分钟,最终输出网页以及Excel表格。输出内容方面,网页部分核心结论从技术、产品维度总结行业趋势,各公司进展介绍篇幅约一两千字,但未完成产品迭代历程及商业化进展梳理的需求,信息收集不够完善;Excel表格整理了核心大模型公司的发布模型、发布时间、模型类型及技术特点,但存在问题:一是发布时间排序错乱,出现先列Cloud 4再列Cloud 3.7的情况;二是模型信息遗漏,如阿里相关模型仅列出5个,整体来看其在B端场景下的优势尚未显著体现。


3、高阶任务助理C端功能测评

餐厅预定功能演示:提出下周三晚上与家人在前滩附近吃火锅的需求后,AI先确认预定座位的具体时间,再弹出窗口要求填写姓氏、性别、电话号码等信息,随后启动任务。该任务耗时7分30秒AI先完成需求分析,再从高德扫街榜筛选出11家前滩附近高评分火锅店,确认订座人信息后致电商家预定,部分预定成功后选出3家供用户最终确定。AI在沟通过程中采用拟人化设计:嗓音接近真人,加入“你好”等口语化表达,还刻意设置停顿以模拟真人说话节奏,每轮对话结束后会表明千问AI身份,但部分商家未听完身份说明就挂断电话。预定成功后,页面仅显示店铺信息而非预定信息,用户直接致电商家确认预定成功,后续因测试需求取消预定,商家对纯AI完成两次电话预定并敲定订单感到震惊。目前页面存在展示不足,预定成功后点击相关标识无法查看预定信息,仅能看到店铺信息。

行程规划功能测试:针对“3月1号坐早上高铁去苏州玩两天,打卡主要景点”的需求,AI耗时5分钟生成网页形式的苏州两日游规划。行程安排合理,第一天规划苏州博物馆、拙政园、狮子林,第二天安排寒山寺、山塘街等景点,与常规旅行社的规划逻辑一致。该功能深度集成高德与飞猪核心资源:高铁票推荐可直接跳转飞猪购票页面(需跳转飞书APP完成最终预定),每个景点配备导航(跳转高德页面)、打车(跳转高德APP)、门票(跳转飞猪页面)操作按钮,还标注了景点间的距离(如拙政园与狮子林相距五六百米)。住宿推荐狮子林附近100-700元档位的高评分酒店,暂未实现基于用户过往偏好的个性化推荐,仅提供大众通用方案。预算测算采用推荐酒店中的最高价668元,整体预算约1400元,支持家庭出游的多人预算测算,还提供景点预约、人流量预警等实用小贴士,能为用户提供较为完善的旅行支持,可直接在页面收藏规划并一键跳转至相关功能入口。

跨店点外卖功能测试:针对8人用餐的复合需求(想吃汉堡、披萨,奶茶需4杯冰的、4杯不冰的),AI耗时不足3分钟输出3套跨店点单方案。前两套方案均较好匹配需求:第一套为蜜雪冰城的8杯奶茶,加上肯德基的4个汉堡以及4份披萨;第二套聚焦高评分店铺,提供结构类似的餐品组合。第三套方案存在需求匹配误差,仅点了8个披萨未包含汉堡,且点了10杯奶茶,超出需求数量。该功能支持直接在千问页面完成下单付款,已能响应较为复杂的多品类、多要求点单需求,为用户提供多样化的餐品组合选择方案,在满足群体用餐的个性化需求上具备一定实用性。


4、高阶任务助理代码能力测试

记单词小游戏开发优化:为验证高阶任务助理的底层代码能力,以备考雅思记单词为场景,提出开发一款移动端交互友好的记单词小游戏需求,要求具备记单词目标制定、记完单词后答题测验的功能。任务助理完成初始开发及修改、跑代码全流程耗时13分钟,最终呈现为网页形式,符合移动端交互友好的要求。初始版本设定90天记2000多个单词的目标,每日记单词数量可在20-30之间调整;单词卡包含英文、词性、中文释义、例句,且带有可正常播放的读音;答题环节设置小红花测试,但答题逻辑不符合需求,为每记一个单词就触发答题,而非记完一部分单词后再进行测验。针对初始版本的答题逻辑问题,提出优化需求,要求调整为记完当日所有单词后再答题,并增加错题记录功能。优化调整耗时10分钟,优化后的版本新增错题记录功能,且与日历数据打通,当天为1月20号时界面同步显示日期,还设有学习日历与“开始今日学习”按钮,单词以乱序形式呈现,但也出现了新的问题:一是读音功能失效,无法正常播放;二是记忆为短时记忆,无法显示之前日期的错题;三是记单词目标变为70天记5000个单词,且该目标无法修改。整体而言,任务助理在较短时间内完成了小游戏的开发与优化,大部分核心需求得到满足,能够体现出较强的端到端代码能力,但优化版本存在功能退化、目标设定无法调整等细节问题。


5、阿里千问功能整体评价

功能表现综合总结:基础功能符合预期,具备较强实用性,如推荐餐厅、一键跳转政务、闪购等场景,用户有明确点单需求时使用可节省时间,还设有特定渠道补贴。AI购物功能不及预期,该功能目前未实现良好整合,仍处于测试阶段,鉴于淘宝是阿里生态的核心王牌APP,市场对其AI购物功能的整合落地抱有较高期待,但此次并未全面开放,因此表现略显不及预期。任务助理C端功能表现超预期,该功能在C端场景展现出出色的端到端能力,且与阿里生态实现了良好结合,串联起各项功能,未来有望为自身生态提供极大赋能,其中规划行程路线、预定餐厅等功能实用性较强。


温馨提示:内容源于第三方以及公开平台,仅供用户参考,恕本平台对内容合法性、真实性、准确性不承担责任。如有异议/反馈可与平台客服联系处理(微信:_LYSD_)