服务粉丝

我们一直在努力
当前位置:首页 > 科技 >

复旦团队研发AI大模型,助力视障者“看见”世界

日期: 来源:复旦大学收集编辑:复旦大学

只需一枚摄像头和一对耳机

便能将画面转化成语言

描绘场景、提示风险

让视障者出行更安全、生活更便捷

日前

在复旦大学自然语言处理实验室

(FudanNLP)师生的努力下

基于多模态大模型“复旦·眸思”(MouSi)

为视障者量身打造的“听见世界”APP上线

将成为视障人士的生活助手与智能管家

科技普惠,AI为人

让我们一起走近“眸思”

看看它能为视障者的日常生活

带来哪些新的改变!

“复旦·眸思”(MouSi)官网链接:

http://www.mousi.org/

欢迎登录试用体验~

打破视觉界限,助力视障者“看见”世界

2023年上半年

由复旦自然语言处理实验室开发的MOSS

被称为中国版的GPT

仅用半年时间

多模态模型“眸思”问世

“眸思”与MOSS同音

但和基于文本的MOSS不同

它能够理解并识别图片内容

致力于成为视障者的一双“眸”

基于“眸思”的“听见世界”APP

为视障者日常生活需求量身打造

设计以下三种模式——

街道行走模式

“眸思”如一位忠实的向导

红绿灯、十字路口、障碍物……

它将细致扫描道路情况

提示潜在风险

陪伴视障者安全通行

“看不见”的漫漫长路

自由问答模式

“眸思”则是一位贴心的朋友

走进博物馆、艺术馆、公园……

捕捉四周景象的每个细节

用声音构建丰富的生活场景

传递每一处日常之美

寻物模式

“眸思”将成为一名可靠的管家

被移动的手杖、最爱口味的牛奶……

日常物件的寻觅过程

变得轻松无压力

邀请视障人士加入,研发贴合真实需求

我国盲人数量有1700多万

也就是说,每一百人中就有一位

但为什么在大多数人的认知里

我们极少在街上看到盲人?

这是因为,面对大量不安全因素

他们难以独自跨出家门


复旦大学自然语言实验室张奇教授说

“人工智能发展日新月异

科技应该要改变更多人的生活

希望‘眸思’能够帮助视障人士走出家门

让他们可以尝试更多工作

为人生书写更多可能

项目落地背后

是一支年轻的团队和开放的氛围

从本科生到博士生共25名复旦学子

及桂韬等多位教师、专家的加入

才有了“眸思”接续“MOSS”的成功

张奇介绍,该项目的主导者

实际上都是“初出茅庐”的学生们

在组内头脑风暴会上

年轻学子总能提出开创性想法

能够找到另辟蹊径的解决办法

自9月以来,

复旦自然语言实验室

从原本基于GPT3.5的文本模型转向

围绕GPT4-v复现多模态大模型

对模型中的核心关键点开展研究

致力于提升单项任务的准确率

大模型的强化学习

为了更好地感受视障者的难处

团队成员同样模拟真实情境

蒙眼探索视障者“黑暗”世界

并邀请视障人士加入

进一步摸清真实而具体的需求

在基于几亿张图片训练出的

“眸思”大模型基础上

针对视障者提出的各类需求

团队又用上万张图片进行特殊样本训练

使“眸思”具备能够适配更多场景的能力

加快升级测试,更多模式值得期待

今年上半年

团队将结合AR升级APP内的

定位精度细化至亚米级别

下半年

团队希望将“眸思”升级到

基于视频的判断

更多模式也正在开发中,比如

阅读模式

服务盲人朋友点菜、读书等场景

解说模式

承担无障碍电影解说员的工作

在政府的支持下

团队计划与NGO组织、智算中心

和硬件厂商等开展合作

致力于让视障者免费使用产品和相关服务

预计今年3月

“听见世界”APP将完成第一轮测试

在我国一、二线城市和地区同步开启试点

根据算力部署情况进行推广

组稿|校融媒体中心

文字|陈书灵

图片|计算机科学技术学院

责编|章佩林

编辑|符梦苑


相关阅读

  • 自贡:寻找检察工作“金点子”

  •   2月27日,自贡市检察院举办数字检察“金点子”创意竞赛,6个区县院同台竞技,从报送的20个大数据法律监督模型创意中选出12个优秀模型进行讲解展示。    参赛选手通过现场
  • Sora“横空出世” 如何“科技向善”?

  • ●Sora实现了从文字能力向多模态能力的重大提升,可能成为OpenAI整合旗下各模型、构造人工智能模型服务体系的开始,是其向通用人工智能迈进的重要一步 ●大众传媒可能是最
  • 扎根、接力,多彩贵州里的复旦人

  • 十年来,从与世隔绝到“万桥飞架”畅通内外、撕掉绝对贫困标签,贵州创下“黄金十年”的发展奇迹。十年来,一批又一批复旦人来到贵州,他们有的是扎根贵州的选调生、校友,有的是用
  • 中国大模型创业风潮:应用创新是下一个突破口

  • 21世纪经济报道记者 董静怡 上海报道从去年的ChatGPT,到今年的Sora,国内对于大模型的讨论居高不下。过去一年以来,资本市场也在试图挖掘出“中国版的OpenAI”。在巨头注资下,月
  • 面向高中生的复旦“周末学堂”来了!

  • @上海高一学生想要踏入复旦大学领略“日月光华,旦复旦兮”的非凡魅力吗?想要与学术大咖们近距离互动,沉浸于知识的海洋感受高等学府的独特氛围吗?想要提前探索学术奥秘体验那些
  • 文生视频模型Sora问世 变革与风险并存

  • 近日,美国人工智能公司“开放人工智能研究中心”(OpenAI)发布了旗下首款文生视频模型Sora,持续引发关注。这是继文本模型ChatGPT和图片模型Dall-E之后,OpenAI又一款极具颠覆性的A

热门文章

  • 解码“新IT”的5个特征和3大价值

  • 党的二十大报告提出,要加快发展数字经济,促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。在数字经济与实体经济深度融合的产业浪潮中,以智能设备、边缘计算
  • OPPO k1的低价高配真实么?网友:不看不知道

  • 近日OPPO一款新机OPPO k1,摒弃了高价低配,就连自家老大哥r17都要怼一下。更是放弃了请代言人,以往的OPPO手机还没出来,各路流量小生,花样美男的代言就先来了。还有线下销售人员的
  • 一招教你手机无限制成为一台新设备

  • 大家平时用手机去注册app,肯定会遇到检测设备异常,交易关闭,等问题 这个都是手机已经不止1-2次注册过此app,不断更换手机仅是一个暂时的方法,却不是长久之计,手机总归会用完
  • 从零开始如何开网店

  • 随着互联网的高速发展,人们的生活发生了翻天覆地的变化,生活节奏越来越快,网购已经成为家家户户生活中离不开的一种购物方式了。网购的发展使得越来越多的人想要涉足电商事业,那

最新文章

  • 临县全面开展冻融期地质灾害隐患排查整治工作

  • 本报讯 日前,临县各级各部门切实增强做好地质灾害防治工作的责任感使命感,增强工作主动性,全县23个乡镇全面开展冻融期地质灾害隐患排查整治工作,真正把“人民至上、生命至上”
  • 张祖林被查!

  • 云南省政府原党组成员、副省长张祖林涉嫌严重违纪违法,目前正接受中央纪委国家监委纪律审查和监察调查。来源:中央纪委国家监委网站
  • 全国政协委员迟日大:让法律知识和服务贴近群众

  • 2024年全国两会召开在即,代表和委员们将齐聚北京共商国是。一年来,肩负着全国人民的重托,带着全国人民的期望,他们交出了怎样的履职答卷?中央广播电视总台吉林总站推出两会特别报
  • 高德地图回应小团团语音包是否下架

  • 近日,有博主爆料斗鱼主播“一条小团团 OvO”涉案被抓登上热搜,引发热议。1月27日,小团团曾在斗鱼鱼吧发动态宣布停播,截止 目前已停播超35天。据悉,2020年9月11日,小团团导航语音