最新文章
-
谷歌发布AI图像生成新工具 Whisk,支持上传多张图片以图生图
谷歌发布AI图像生成工具 Whisk ,支持通过上传图像来生成新图像,无需复杂的文本提示。可以为图像的主题、场景和风格提供多张图像作为提示,或者使用谷歌自动…… -
全球最大的仓储机器人公司赴港上市,蚂蚁英特尔是股东
极智嘉作为全球最大的仓储履约AMR解决方案提供商,已向港交所提交招股书,计划在主板上市。极智嘉已连续五年保持领先地位,服务全球约770家终端客户,包括60家…… -
谷歌版Sora迎来 Veo 2,升级4K高清!一句话控制镜头运动,Imagen 3 再进化
谷歌版Sora升级至 Veo 2.0 ,能根据文本或图像生成4K高清视频,理解镜头控制指令。在模拟现实物理和人类表情方面有显著提升,能精确遵循复杂的指令Prompt。在M…… -
OpenAI直播发布第8天:ChatGPT Search全面升级,免费开放,与Her打通了!
OpenAI直播第8天,ChatGPT推出 Search 搜索功能升级,包括移动端优化和多模态信息搜索,结合Her功能实现实时通话中的语音搜索。基于微调后的GPT-4o模型,使用…… -
Kimi 发布 k1 视觉思考模型,多项理科测试行业领先
月之暗面 Kimi 今日发布 k1 视觉思考模型 ,模型基于强化学习技术,支持端到端图像理解和思维链技术,覆盖数学、物理、化学等基础科学领域。k1模型在多项基准…… -
腾讯微信正式发布多模态大模型 POINTS 1.5,10B参数下开源模型排名第一
腾讯发布多模态大模型 POINTS 1.5 ,继承了POINTS 1.0的LLaVA架构,包含视觉编码器、投影器和大语言模型。模型在效率和性能上均有显著提升,特别是在复杂场景O…… -
PixVerse最新AI特效上线,心情不好,“爆炸”一下!
爱诗科技 PixVerse AI视频生成工具,在社交平台引发特效热潮,共上线12种变身特效,有火爆出圈的“毒液变身”,“压扁”,“爆炸”等,短短几天便迅速火遍抖音,备受…… -
OpenAI 推出 Projects,功能全家桶打造 ChatGPT 新交互方式,迈向“万能应用”
OpenAI在“OpenAI 12天”活动第7天推出了ChatGPT的新功能 Projects ,功能支持用户上传文件、自定义指令、分组聊天和数据管理,整合Canvas和ChatGPT Search,提…… -
久等了,DeepSeek开源 DeepSeek-VL2 MoE视觉模型:支持动态分辨率、解析梗图等
DeepSeek推出 DeepSeek-VL2 AI视觉模型,模型采用DeepSeek-MoE架构结合动态切图技术,提升视觉能力。模型在视觉定位、梗图解析、OCR和故事生成等方面展现出新…… -
上新!阶跃星辰 Step-1o 千亿参数端到端语音大模型来啦!
阶跃星辰发布国内首个千亿参数端到端语音大模型 Step-1o 。模型支持语音和文本混合输入输出,具备高智商和情商,能理解语音背后的情绪信息,提供专业建议和情……
友情链接