博文

目前显示的是 三月, 2023的博文

Ai文字轉語音、語音轉文字! 這幾種方法你最好要知道

图片
Ai文字轉語音、語音轉文字! 這幾種方法你最好要知道 从此存储库的“发布”部分下载 WhisperDesktop.zip,解压缩 ZIP,然后运行 WhisperDesktop.exe。 在第一个屏幕上,它会要求您下载模型。我推荐ggml-medium.bin(大小为 1.42GB),因为我主要使用该模型测试了软件。 下一个屏幕允许转录音频文件。 还有另一个屏幕允许从麦克风捕获和转录或翻译实时音频 特征 基于 DirectCompute 的供应商不可知的 GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器” 纯 C++ 实现,除了基本的 OS 组件外没有运行时依赖性 比 OpenAI 的实现快得多。 在我配备 GeForce 1080Ti GPU 的中型台式计算机上, 使用 PyTorch 和 CUDA 转录 3 分 24 秒的演讲需要 45 秒,但使用我的实现和 DirectCompute 只需要 19 秒。 趣闻:这是 9.63 GB 的运行时依赖项,而 431 KB Whisper.dll 混合 F16 / F32 精度:自 D3D 版本 10.0 起,Windows 需要 缓冲区 的支持 R16_FLOAT 内置性能分析器,可测量单个计算着色器的执行时间 内存使用率低 用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis 除外),以及大多数在 Windows 上运行的音频捕获设备(除了一些专业的,它们只实现 ASIO API ) 。 用于音频捕获的语音活动检测。 该实现基于Mohammad Moattar 和 Mahdi Homayoonpoor 于 2009 年发表的文章 “一种简单但高效的实时语音活动检测算法”。 易于使用的 COM 风格 API, nuget 上可用的惯用 C# 包装器 提供预构建的二进制文件 唯一受支持的平台是 64 位 Windows。应该可以在 Windows 8.1 或更高版本上运行,但我只在 Windows 10 上测试过。该库需要支持 Direct3D 11.0 的 GPU,这在 2023 年就意味着“任何硬件 GPU”。最新的不支持 D3D 11.0 的 GPU 是 2011 年的 Intel Sandy Bri...

FFmpeg循环推流脚本

图片
  FFmpeg 循环推流脚本 撸了个FFmpeg的循环推流脚本,你的VPS除了吃灰以外还能24小时不间断直播视频。自己用的脚本,单纯分享一下,如有问题自行解决。 7×24小时陪伴型直播 一个躺着就能创业的新项目 我来手把手教你怎么搞 1:需要配合screen运行: 只是安装一个叫做screen的一个窗口管理的工具 直接敲Yum这一行就可以不用管上下的 然后安装完了之后他会提示completed **yum -y install screen** 2:开个新窗口: **screen -S stream** 3:首先这里我们需要先敲命令来创建一个目录 一个都不要打错 打错了就运行不起来了 首先mkdir(make directory)就是创建一个目录的意思 mkdir /home /1ighthouse/ffmpg 我们创建好这个目录之后 敲这个指令进到我们刚才创建的目录 cd /home /lighthouse/ffmpg 我们来复制一串脚本 完整代码如下:复制 这个脚本是一个叫做拉拉的兄弟写的 然后粘到这直接粘到这来 他放在自己的网页上了 然后我会把网页的地址放到评论区 然后大家可以进到这个页面里面复制这串脚本命令 但是如果说你熟悉Linux的朋友 其实我们要做的事情大概就是三四行代码就可以写完 这哥们为什么写了个这么复杂的一个脚本 他是针对小白用户的 他会带一些命令提示 然后教你一步一步的自动化的操作 所以这个是比较小白friendly的这么一个做法 就相当于他写了个程序帮你去装 但实际上如果朋友你会自己写的话 但实际上如果朋友你会自己写的话 其实四五行三四行就能写完;然后这个哥们的脚本可以直接用 但是里面为了要实现我们定义一些我们自己视频的一些要求的话 我一会儿会有几个地方要改;一会儿我会跟大家说 然后把命令粘过来之后直接回车 然后选择1一是我们为了要装我们现在要用到的FFmpeg 什么是FFmpeg 我跟大家解释一下FFmpeg是个开源的 帮你去做你的视频编解码;然后推流的一个工具 相当于我们现在为了跑这个脚本;就是为了装这个工具 所以我们敲下1 1就是安装 然后回车之后我们输入yes yes 这个过程就很漫长了;如果说你挑一个香港的主机或者是境外的主机 从境外的源...