服务粉丝

我们一直在努力
当前位置:首页 > 财经 >

开源、免费、本地运行,够了吧?

日期: 来源:小众软件收集编辑:青小蛙

Whisper 是一个由 OpenAI 训练并开源的神经网络,在英语语音识别方面的稳健性和准确性接近人类水平。whisper.cpp 项目是将 Whisper 移植到 C/C++ 中,而今天介绍的 Const-me/Whisper 项目则是 whisper.cpp 在 Windows 上的实现,并增加了显卡的支持,使得速度大幅提升。@appinn


来自发现频道,@JoeCubber 同学推荐:https://meta.appinn.net/t/topic/41478

语音转录工具,类似青小蛙之前推的buzz,但是使用GPU速度更快

Buzz 是青小蛙在去年 11 月推荐的一个工具:Buzz – 开源、可离线的实时语音转文字工具,支持 Windows、macOS、Linux,它可以将麦克风的语音实时转换为文字,也支持将视频、音频文件转换为文字、字幕。

下载 Whisper 模型

而 Const-me 的这个名为 Whisper 的项目,目前仅提供 Windows 版本,使用简单,需要先下载模型:

  • ggml-medium.bin https://huggingface.co/datasets/ggerganov/whisper.cpp/blob/main/ggml-medium.bin

开发者推荐 ggml-medium.bin,因为一直在使用这个模型进行测试,1.53 GB 大小。

使用 Whisper

在 Model Path 里面选择你下载的模型,然后选择 GPU 就能进入软件了。


之后,就可以选择通过麦克风实时转换,或者使用音频文件比如 MP3 来转换为文字了:


青小蛙随便测试了一个极客湾的视频(仅下载了音频),效果如下:

准确度很高,基本上比较满意。

由于是在虚拟机中测试,显卡性能有限,所以时间不具有参考性。

不过,开发者的测试是在装有 GeForce 1080Ti GPU 的台式电脑上,中型模型,3 分 24 秒语音使用 PyTorch 和 CUDA 转录需要 45 秒,但使用这个和 DirectCompute 只需要 19 秒。而 @JoeCubber 同学测试的是 11:31 分钟的音频,耗时1分26秒完成。

当然,你需要有显卡。

实在是没想到,挖矿之后,显卡又有了用武之地。

获取

  • Github(点击右侧 Releases 部分直接下载 WhisperDesktop.zip 即可)

    https://kutt.appinn.com/mzrcn7

  • ggml-medium.bin 模型搬运:夸克网盘 https://pan.quark.cn/s/c896fb0de9b8

原文:https://www.appinn.com/const-me-whisper/

相关阅读

  • 【国盛计算机】ChatGPT应用第三次展望

  • 核心观点基础模型+细分领域微调,GPT可落地千行百业。预训练大模型相对通用,通过结合细分领域数据与KNOW-HOW,大模型可以针对垂直领域做微调优化,在各行各业落地。相比细分领域模
  • ChatGPT造孽!中国高校因它算力荒

  • 衡宇 发自 凹非寺量子位 | 公众号 QbitAI不做大模型,就没有算力用。这是ChatGPT点燃AI风口后,国内某top3高校AI实验室的残酷现状。同一个实验室里,非大模型团队6人用4块3090卡,
  • ChatGPT爆火之后,AIGC往何处去?

  • 作者:陈石来源:峰瑞资本(ID:freesvc)“ChatGPT”可能是从2022年底至今,最为出圈的科技热词之一。GPT是Generative Pre-trained Transformer的缩写,表示生成型预训练变换模型。这个

热门文章

  • “复活”半年后 京东拍拍二手杀入公益事业

  • 京东拍拍二手“复活”半年后,杀入公益事业,试图让企业捐的赠品、家庭闲置品变成实实在在的“爱心”。 把“闲置品”变爱心 6月12日,“益心一益·守护梦想每一步”2018年四

最新文章

  • 酥~香~嫩~滑!都在这儿了

  • 为什么人对“滋啦滋啦”的食物总有种莫名的着迷:荷包蛋刚出锅时的脆边,铁板上散发出阵阵香气的肉片和牛排,金黄酥脆的饼干、爆米花……这一切都得益于烹饪中最重要的化学反应,美
  • 超对味的口水鸡,用10个鸡腿摸索出的配方!

  • ⚬ 有灵魂的酱汁,不一样的成色。保姆级教学,厨房小白也能复刻出餐厅出品般的效果。食谱作者@德柱小食堂:“口水鸡本质上就是把煮好的鸡切块淋上料汁,但想做到卖相好,同时味道好,却
  • 开源、免费、本地运行,够了吧?

  • Whisper 是一个由 OpenAI 训练并开源的神经网络,在英语语音识别方面的稳健性和准确性接近人类水平。whisper.cpp 项目是将 Whisper 移植到 C/C++ 中,而今天介绍的 Const-me/Wh
  • 圆明园再通报:攀爬文物者被行拘、禁入!

  • 近日,一组游客不文明行为的视频被传到网上。视频画面显示,多名男子跨越围栏,进入圆明园大水法遗址内部,而旁边就竖着“请勿入内”的提示牌。其中一人攀爬到几米高的石柱残骸顶部