千问Qwen-Image-2.0发布 超强文字渲染 信息图 PPT轻松做

今日,阿里巴巴正式发布新一代图像生成及编辑模型Qwen-Image-2.0。作为千问大模型的图像生成模型底座,Qwen-Image-2.0集生图和编辑于一体,在AI Arena文生图评测中斩获1029分,超过Seedream4.5、Flux2-Max等模型,仅次于谷歌Nano Banana Pro和GPT Image1.5。

Qwen-Image-2.0支持1K token的超长文字输入和2K高分辨率,可准确渲染复杂指令,轻松生成专业的PPT及信息图,质感媲美专业级摄影师;同时,千问新模型拥有极强中文汉字渲染能力,数百字的古文全文几乎都能完全渲染在图片中。

Qwen-Image-2.0在Qwen-Image和Qwen-Image-Edit两大模型基础上全新升级,首次将图像生成和编辑统一到一个模型中去,以更轻量的模型架构,实现了生图和改图性能的大幅提升。

Qwen-Image-2.0生图质感尤为细腻,小至老人皱纹的褶皱,大到浩然宇宙,模型生成的人物、自然、建筑等常用图片都极其逼真。

在权威评测AI Arena中,千问新模型在图像生成中得分1029,位列第三;在图片编辑中得分1034,仅次于Nano Banana Pro。

在中文汉字渲染方面,Qwen-Image-2.0表现极为突出,不但可以以多种字体准确渲染汉字,而且写得又多又准,效果比 Nano Banana Pro更优。

千问新模型将输入提示词扩展到1K token,可详尽描述任务,实现更专业的文字渲染,轻松拿捏专业PPT、高级海报、多格漫画等复杂图片,比如以小楷字体几近完全渲染《兰亭集序》数百字的全文配图,以自然语言生成论文格式配图的复杂PPT等。

基于Qwen-Image-2.0模型,用户可与AI协同创作出更丰富、更实用的图片,比如一句话生成宫保鸡丁的做法流程图,杭州两日旅游攻略图,4x6的多格漫画组图,儿童绘本图,写实风格的电影海报,极为逼真的绿色丛林等等;

同时,用户也可上传数张图片进行编辑,生成诸如九宫格多手势自拍,真人配字表情包,双人逼真AI合影,诗词配图等。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
来自频道: @AI_News_CN
AI 版“App Store”来了?亚马逊入局内容授权市场:出版商向大模型“收租”时代开启

大模型时代的版权之争,或许终于迎来了由科技巨头主导的“和解方案”。亚马逊正计划推出一个全新的 AI 内容市场,旨在筑起出版商与 AI 大模型开发者之间的价值桥梁。

告别“免费午餐”,内容授权开启正规化。

长期以来,出版商与 AI 公司就训练数据的版权问题纠葛不断。据知情人士在AWS会议上透露,亚马逊的这一新计划将允许出版商直接向科技公司出售内容版权。

计费模式变革:出版商目前正提议基于“使用量”来收取费用,而非一次性买断。

合法交易渠道:该市场将与AWS的 AI 工具及开发者生态深度整合,为内容提供者和开发者提供合法的版权交易路径。

亚马逊的“一石三鸟”之计。

亚马逊此举不仅是为了平息版权争议,更深藏着其在 AI 生态中的战略野心:

扩展 AWS 价值链:通过“内容+AI”市场,让AWS从单纯的算力提供者进化为资源撮合平台。

稳固云计算地位:提升AWS的客户粘性,开辟全新的营收增长曲线。

构建 AI 供应链:配合亚马逊未来在 AI 领域的重金投入,打造全球领先的 AI 供应链体系。

巨头角力:微软也在秘密入场。

亚马逊并非唯一的玩家,据悉微软也在同步开发类似的出版商内容市场。当 AI 模型对高质量数据的渴求达到顶峰,谁能率先搞定出版商,谁就掌握了下一代 AI 进化的话语权。

正如亚马逊(中国)投资有限公司等分支机构所体现的全球化布局,亚马逊正试图通过规则的重塑,将零散的版权资源整合进其庞大的 AI 帝国版图。

via AI新闻资讯 (author: AI Base)
来自频道: @AI_News_CN
算力不够,友商来凑?Kimi 官宣回应“宕机”:正在找算力,急用先去 DeepSeek

大模型时代的“神仙打架”,竟然打出了几分江湖义气。2 月 10 日,针对近期频繁出现的算力告急问题,月之暗面 (Moonshot AI)旗下的 AI 助手 Kimi 给出了一份极具个性的回应。

高峰时段“被挤爆”,Kimi 坦诚算力不足。

近日,不少网友发现 Kimi 出现了“间歇性罢工”。 页面频繁跳出提示:“高峰时段算力不足,已切换至 K2.5 快速,升级会员畅用思考模型。” 显然,即便已经快速迭代,Kimi 依然没能抵挡住用户海量请求带来的服务器压力。

教科书级公关:不仅认错,还给“指路”。

面对网友的反馈,月之暗面 Kimi的官方回复显得既接地气又颇具幽默感:“嗯,正在找算力。要不先用 DeepSeek。” 这一举动迅速引发热议,被网友戏称为“AI 界的互助楷模”。

AI 领域的“新常态”:好产品太多,算力快跟不上了。

Kimi 主动“引流”给对手DeepSeek,侧面印证了两件事:

● 用户量暴涨:国产大模型正在经历前所未有的用户增长期。
● 算力荒:大模型对高性能计算资源的渴求依然是所有玩家面临的共同考题。

在这个芯片比金子贵的节点,Kimi 的坦诚不仅化解了用户的负面情绪,还顺带拉升了一波品牌好感度。 毕竟,在“找算力”的路上,大家都是并肩作战的战友。 至于 Kimi 何时能满血回归,或许正如它所说,得看那批“救命”的算力什么时候能到位了。

via AI新闻资讯 (author: AI Base)
来自频道: @AI_News_CN
AI 外呼告别“盲目自嗨”!声网联手美团发布 VoiceAgentEval:首个行业评测基准让 AI 更有“人味”

长久以来,AI 外呼行业一直缺乏一把公认的“度量衡”。就在今天,声网联手美团及 xbench 正式发布了针对 AI 外呼场景的智能体评测基准——VoiceAgentEval,旨在填补行业空白,推动 AI 模型向真实业务场景加速转变。

拒绝实验室数据,用真实业务“练真金”。

VoiceAgentEval 的最大亮点在于其“实战性”:

覆盖面广:涵盖了6大业务领域的30个子场景,力求还原最真实的市场需求。

语料库真实:基于真实外呼业务数据构建,摒弃了传统的死板脚本。

双维度评估:不仅看文本生成的逻辑是否正确,更加入语音维度的评估,全面审视 AI 在对话中的综合表现。

150种对话模拟,AI 演练更丝滑。

为了测试模型的任务遵循度和通用交互能力,评测框架通过用户模拟器构建了150种虚拟对话场景。这就像给 AI 安排了一场场“模拟考”,评估其在面对不同用户反馈时,能否始终稳健地推进业务流程。

谁是目前的 AI 外呼“尖子生”?

据悉,通过该评测标准的初步筛查,目前已确定了在 AI 外呼场景中综合性能排名前三的模型。这一结果不仅为行业树立了技术标杆,也为相关企业(如北京三快科技有限公司等)在后续的 AI 业务部署中提供了权威参考。

VoiceAgentEval 的发布,标志着 AI 外呼行业正式从“拼技术参数”时代迈入“拼业务实效”时代。在评测标准的驱动下,未来的 AI 外呼将更加智能、高效,且更具人性化关怀。

via AI新闻资讯 (author: AI Base)
来自频道: @AI_News_CN
生图编辑合二为一!Qwen-Image-2.0发布:2K 极致质感挑战视觉极限

2026年2月10日,阿里云正式推出新一代图像生成基础模型 Qwen-Image-2.0。该模型标志着通义千问在图像能力上的重大突破,成功将“图像生成”与“图像编辑”两条研发支线合二为一,在多项盲测基准中展现出卓越性能。

核心技术突破

Qwen-Image-2.0采用7B 轻量化架构,在维持高速推理的同时,实现了以下四大核心优势:

● 专业的文字渲染(“准”与“多”): 支持高达1k token 的超长复杂指令。无论是复杂的 PPT 页面、专业信息图表(如 A/B 测试报告、OKR 工作法图解),还是含中英双语的海报,模型均能实现像素级的精准排布与多介质渲染。
● 极致的真实质感(“真”): 原生支持2K 分辨率(2048×2048),能够细腻刻画皮肤毛孔、织物纹理及建筑细节,在电影海报等写实场景中表现尤为出色。
● 统一的生图编辑能力: 作为一个 Omni(全能)模型,它实现了理解与生成的深度融合。用户可直接在现有图片上进行书法题词、跨次元内容添加或多图自然合成,无需切换模型管线。
● 审美与对齐(“美”与“齐”): 模型具备极高的排版美学,能自动在画面留白处布置文字(如宋词水墨画),并确保多格漫画或复杂表格中的文本规整对齐。

丰富的使用场景

从赵孟頫的行楷、宋徽宗的瘦金体到王羲之的小楷,《兰亭集序》等长篇书法作品均能实现准确渲染。此外,Qwen-Image-2.0还能处理具有复杂逻辑的4x6漫画生成,并确保角色的一致性与对话框的自然对齐。

目前,Qwen-Image-2.0已在阿里云百炼平台开启 API 邀测,广大开发者和用户也可通过Qwen Chat免费体验这一前沿模型。

via AI新闻资讯 (author: AI Base)
来自频道: @AI_News_CN
字节TRAE上线Skills!10个宝藏技能包,直接抄作业

via 掘金人工智能本月最热 (author: 阿星AI工作室)
来自频道: @AI_News_CN
美国白宫拟出台新的数据中心能源协议

由于AI数据中心耗能巨大,该行业日益成为撕裂美国社会的一个关键矛盾,越来越多的民众和组织要求美国政府暂停数据中心建设审批,以保护普通家庭和其他行业的能源供应。两名政府官员称,白宫希望一些人工智能巨头公开承诺遵守一项新的协议,以规范数据中心的快速扩张。具体而言,白宫的协议旨在确保数据中心不会提高家庭电价、不会加剧供水紧张或不会破坏电网可靠性的承诺,且推动需求激增的公司必须承担建设新基础设施的成本。参与该协议的公司可能包括 OpenAI、微软、谷歌、亚马逊、Meta 以及其他人工智能巨头。这项协议据称是一项自愿协议,且条款尚未最终确定。

—— 财联社

via 风向旗参考快讯 - Telegram Channel
来自频道: @AI_News_CN
具身智能新突破!达摩院开源 RynnBrain,包揽 16 项全球榜单冠军

具身智能领域迎来重磅玩家。阿里巴巴达摩院今日正式发布了名为 RynnBrain 的具身智能大脑基础模型,并一次性向开发者社区开源了包括30B MoE 规模在内的7个全系列模型。这一举动标志着国产具身大脑基座模型在开源生态中迈出了坚实一步。

据介绍,RynnBrain 的核心突破在于首次赋予了机器人时空记忆与空间推理能力。通过这两项关键能力的深度集成,机器人的智能交互水平实现了质的跃升,能够更精准地理解物理空间并执行复杂指令。在最新公布的16项具身智能开源评测榜单上,RynnBrain 刷新了全部纪录(SOTA),其表现已超越谷歌 Gemini Robotics ER1.5等国际顶尖模型。

此次开源涵盖了不同参数规模的模型,旨在适配多样化的工业及服务机器人场景。达摩院表示,通过开源 RynnBrain 系列模型,希望能降低具身智能的研发门槛,加速让机器人走进现实生活。

项目:https://github.com/alibaba-damo-academy/RynnBrain

via AI新闻资讯 (author: AI Base)
来自频道: @AI_News_CN
继元宝和千问之后,豆包也撒钱了!官宣上总台春晚,除夕狂送 10 万份科技豪礼

2026年春节的 AI 红包大战进入白热化阶段。继腾讯元宝豪掷10亿现金、阿里千问开启30亿免单活动后,字节跳动旗下的 AI 助手豆包也于2月10日正式官宣“豆包过年”新春活动,并确认将登上总台春晚。

不只撒红包,还要送“未来”。

不同于传统的现金补贴,此次豆包准备了极具科技感的“重头戏”。 官方宣布将送出超过 10万份 接入豆包大模型的科技产品,涵盖了智能生活的方方面面:

前沿硬核类:宇树机器人、大疆无人机、拓竹3D 打印机等。

智能家电类:极米投影仪、苏泊尔电饭煲等。

重磅大奖:甚至还包括上汽奥迪 E5Sportback 和奔驰 CLA 两款电车的短期使用权。

值得注意的是,这些奖品并非普通版本,而是通过火山引擎深度融合了豆包大模型能力的“智增版”。

攻略指南:除夕夜是“决战时刻”。

活动分为两个阶段进行,想参与的读者可以定好闹钟:

预热期(2月13日20点起):进入豆包 App体验 AI 拜年等玩法,即可参与红包抽奖并提现。

爆发期(2月16日除夕夜):作为总台春晚独家 AI 云合作伙伴,豆包将在直播互动期间开启三轮抽奖,这也是科技大礼包集中发放的高峰时刻。

从火山引擎成为春晚独家 AI 云合作伙伴,到豆包壕送10万份智能硬件,字节跳动显然想借春晚这个超级流量池,让 AI 真正从屏幕里的对话框,走进千家万户的客厅与厨房。

via AI新闻资讯 (author: AI Base)
来自频道: @AI_News_CN
OpenAI携ChatGPT“入主”美国防部AI平台

美国国防部将与 OpenAI 合作,将ChatGPT集成到该机构的通用人工智能平台GenAI.mil中。美国国防部在最新声明中写道:“此次合作将使OpenAI先进的大型语言模型能够便捷地供战争部所有300万人员使用。ChatGPT的投入使用将有助于提升任务执行能力和战备水平,为联合部队提供可靠的人工智能能力。”据声明介绍,自部署以来仅两个月,美国国防部的企业级人工智能平台GenAI.mil的独立用户数量就已突破一百万。GenAI的应用范围涵盖所有军种,已成为国防部安全可靠、随时可投入任务的人工智能通用平台。

—— 财联社

via 风向旗参考快讯 - Telegram Channel
来自频道: @AI_News_CN
进军印度受阻?Anthropic 遭遇重名诉讼,本土公司索赔千万卢比

就在全球 AI 巨头 Anthropic 雄心勃勃地扩张其印度版图时,一场突如其来的法律纠纷为其蒙上了阴影。据 TechCrunch 报道,印度本土一家名为“Anthropic Software”的软件公司已向卡纳塔克邦商业法院提起诉讼,指控这家美国 AI 独角兽侵犯其商标权。

该本土公司在诉状中表示,他们早在2017年起就开始使用“Anthropic”这一名称,而美国 Anthropic 最近的市场动作已导致其客户产生严重混淆。为此,原告方要求法院承认其优先使用权,并索赔1000万卢比(约合11万美元)的经济损失。目前,法院已向美国 Anthropic 发出传票,但尚未批准临时禁令,案件预计将于2月16日再次开庭。

印度作为全球增长最快的互联网市场之一,正成为 AI 巨头的必争之地。为了深耕当地,Anthropic 去年10月宣布设立印度办事处,并于近期挖来前微软印度董事总经理 Irina Ghose 领军。尽管面临法律挑战,其首席执行官 Dario Amodei 仍计划参加下周在德里举行的 AI 峰会。这起“重名”风波不仅凸显了科技巨头全球扩张中的商标合规风险,也反映出本土企业与国际巨头在品牌护城河上的正面较量。

划重点:

⚖️ 遭遇重名诉讼: 印度本土公司 Anthropic Software 称自2017年起已使用该名称,指控美国 Anthropic 侵权并索赔千万卢比。
🇮🇳 深耕印度市场: Anthropic 正加速在印布局,包括设立办事处及聘请前微软高管负责运营,将其视为继欧美后的关键战场。
📅 后续法律进展: 法院目前拒绝了原告的临时禁令申请,维持现状并要求双方于2月16日再次出庭。

via AI新闻资讯 (author: AI Base)
来自频道: @AI_News_CN
🚀 中国的“敏捷威权主义”:在政治控制与技术创新间寻求平衡

长期以来,外界普遍认为威权体制会因压制和腐败阻碍创新,但中国通过推行“敏捷威权主义”(Smart Authoritarianism)打破了这一传统认知。该模式的核心在于,中国共产党在维持政治控制的同时,通过调整治理工具适应全球信息时代,为企业家和创新者提供必要的空间,从而在不削弱权力的前提下驱动增长。

在人才与制度建设方面,中国通过大规模投资高等教育,在2025年莱顿大学全球科研产出排名中占据了前十名中的八席,并成为全球科学与工程博士产出最多的国家。政府不仅推行了严格的公务员选拔制度以提升治理效能,还逐步完善产权保护和商业法以吸引外资。在社会控制上,中国已从传统的高强度镇压转向利用人工智能、人脸识别等技术进行精准监控,并通过操纵网络流量、发布亲政府内容以及私下施压等手段,更微妙地引导公共舆论并抑制集体行动。

这一战略已产生显著成果。2025年,中国在“全球创新指数”中位列前十,超越了法国、德国和日本。在电动汽车、先进电池和可再生能源领域,中国企业已占据全球主导地位。在人工智能领域,尽管面临外部出口管制,中国仍研发出DeepSeek R1等高性能模型,并涌现出以“六虎”为代表的顶尖初创企业。此外,中国军方正将人工智能整合进指挥、监控与无人作战系统,并开发出可避开导弹防御系统的轨道打击技术。

尽管面临人口老龄化和房地产市场低迷等挑战,中国政府仍表现出较强的政策适应力。2025年,中国设立了约1400亿美元的政府引导基金,重点投向人工智能、量子技术和氢能等战略领域。目前,中国按购买力平价计算的GDP已超过美国,其影响力正通过输出治理模式和塑造国际机构议程向全球扩张。文章强调,中国已证明威权体制能够通过自我调适实现有效创新,美国及其盟友必须将其视为一个具备长期竞争力

(foreignaffairs)

via 茶馆 - Telegram Channel
来自频道: @AI_News_CN
蚂蚁阿福成为央视CCTV健康生活合作伙伴

2月10日消息,健康AI应用“蚂蚁阿福”成为央视CCTV健康生活合作伙伴。作为专业的健康AI应用,阿福上线后用户数快速增长,单日解答用户健康咨询1000万次。蚂蚁阿福与全国各地卫健委、医保局合作,已连接全国5000家医院、30万真人医生,为用户提供从健康问答到数字化就医的全链路服务。

此外,全国六位院士领衔1000多位名医,在阿福App上开设了“名医AI分身”,让远在农村乡镇的用户也能通过手机方便地咨询名医专家。

via AI新闻资讯 (author: AI Base)
来自频道: @AI_News_CN
腾讯混元推出首个产业级2Bit端侧模型:0.3B体量实现性能逆袭

大模型落地端侧的“减脂增肌”迎来重大突破。腾讯混元今日正式发布面向消费级硬件的极小模型 HY-1.8B-2Bit。该模型通过首个产业级2Bit 量化方案,将等效参数量精简至 0.3B,内存占用仅约 600MB,体积甚至小于部分常用的手机应用。

技术突破:2Bit量化的“不可能任务”

在模型部署中,量化位数越低,精度损失通常越大。为攻克这一难题,腾讯混元团队放弃了传统的 PTQ(后量化)策略,转而采用 量化感知训练(QAT),并结合数据优化、弹性拉伸量化及策略创新。

实验数据表明,HY-1.8B-2Bit 在数学、代码及科学等核心指标上,表现已能与4Bit PTQ 模型版本持平。这意味着在大幅压缩体积的同时,模型依然保持了极强的“全科能力”。

性能表现:生成速度翻倍,适配多种硬件

得益于极致的压缩,该模型在真实端侧设备上的生成速度对比原始精度模型提升了 2—3倍。具体表现如下:

● MacBook M4: 在1024输入内,首字时延实现 3~8倍 加速,生成速度保持2倍以上稳定提升。
● 天玑9500: 对比 Q4格式,首字时延加速 1.5~2倍,生成速度加速约 1.5倍
● 全思考能力: 沿用 Hunyuan-1.8B-Instruct 的长短思维链能力,用户可根据任务复杂度灵活切换。

未来布局

目前,该模型已提供 GGUF-int2 格式权重,并在 Arm SME2 技术平台上完成适配,可广泛应用于手机、耳机及智能家居等对离线部署和隐私有极高要求的场景。腾讯混元表示,未来将通过强化学习与模型蒸馏,进一步缩小低比特模型与全精度模型的能力差距。

via AI新闻资讯 (author: AI Base)
来自频道: @AI_News_CN