Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

RTranslator – 一款 Android 开源离线本地实时同传翻译 APP

By: Anonymous
24 June 2024 at 13:56

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

RTranslator 是一款适用于 、离线、实时的翻译应用程序。RTranslator 使用 Meta 的开源 模型 NLLB 进行翻译,使用 的开源 AI 模型 Whisper 进行语音识别,是一款可以直接在手机上运行的开源离线本地实时 AI 同传翻译 ,在境外也不用担心因为手机无信号或无流量而无法使用了。

Open source real-time translation app for Android that runs locally – niedev/RTranslator

如果双方手机都安装了 RTranslator 这个模式可以实现(几乎)实时的语音翻译对话。适用于会议或者长对话场景。

RTranslator – 一款 Android 开源离线本地实时同传翻译 APP

对话模式更适合长对话,对讲机模式则适用于临时对话场景,比如问路或者买东西时的对话。

就是个正常的翻译器,复制文字进去,选择什么语言翻译到什么语言,点翻译就给你翻译。

Seal – 基于 yt-dlp 的安卓开源音、视频下载应用,支持几乎所有在线平台

By: Anonymous
21 April 2024 at 11:24

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

Seal 是一款安卓在线,基于著名的开源下载 yt-dlp,支持从数千个视频平台下载视频,内置了 aria2 下载器。

🦭 Video/Audio Downloader for , based on yt-dlp, designed with Material You – JunkFood02/Seal

又是一款将原本需要在电脑进行处理的活,迁移到了安卓手就上进行。

Seal 在 GitHub 开源,上架 f-droid,主要功能:

尝试了一下,效果还是非常不错的,有几个点:

Meta 最强开源大模型 Llama 3 开卷 GPT-4, 马斯克点赞 | 附体验链接

By: Anonymous
12 April 2024 at 17:22

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

没有出乎太多意外,Meta 带着号称「有史以来最强大的大模型」Llama 3 系列模型来「炸街」了。

Build the future of AI with Meta Llama 3. Now available with both 8B and 70B pretrained and instruction-tuned versions to support a wide range of applications.

具体来说,Meta 本次开源了 8B 和 70B 两款不同规模的模型。

以上还只是 Meta 的开胃小菜,真正的大餐还在后头。在未来几个月,Meta 将陆续推出一系列具备多模态、多语言对话、更长上下文窗口等能力的新模型,其中超 400B 的重量级选手更是有望与 Claude 3 超大杯「掰手腕」。

与前代 Llama 2 模型相比,Llama 3 可谓是迈上了一个新的台阶。

得益于预训练和后训练的改进,本次发布的预训练和指令微调模型是当今 8B 和 70B 参数规模中的最强大的模型,同时,后训练流程的优化显著降低了模型的出错率,增强了模型的一致性,并丰富了响应的多样性。

扎克伯格曾在一次公开发言中透露,考虑到用户不会在 WhatsApp 中向 Meta AI 询问编码相关的问题,因此 Llama 2 在这一领域的优化并不突出。

而这一次,Llama 3 在推理、代码生成和遵循指令等方面的能力取得了突破性的提升,使其更加灵活和易于使用。

基准测试结果显示,Llama 3 8B 在 MMLU、GPQA、HumanEval 等测试的得分远超 Gemma 7B 以及 Mistral 7B Instruct。用扎克伯格的话来说,最小的 Llama 3 基本上与最大的 Llama 2 一样强大。

Llama 3 70B 则跻身于顶尖 AI 模型的行列,整体表现全面碾压 Claude 3 大杯,与 Gemini 1.5 Pro 相比则是互有胜负。

为了准确研究基准测试下的模型性能,Meta 还特意开发了一套新的高质量人类评估集。

该评估集包含 1800 个提示,涵盖 12 个关键用例:寻求建议、头脑风暴、分类、封闭式问答、编码、创意写作、提取、塑造角色、开放式问答、推理、重写和总结。

出于避免 Llama 3 在此评估集上出现过度拟合,Meta 甚至禁止他们的研究团队访问该数据集。在与 Claude Sonnet、Mistral Medium 和 GPT-3.5 的逐一较量中,Meta Llama 70B 都以「压倒性胜利」结束了比赛。

据 Meta 官方介绍,Llama 3 在模型架构上选择了相对标准的纯解码器 Transformer 架构。与 Llama 2 相比,Llama 3 进行了几项关键的改进:

训练数据的数量和质量是推动下一阶段大模型能力涌现的关键因素。

从一开始,Meta Llama 3 就致力于成为最强大的模型。Meta 在预训练数据上投入了大量的资金。据悉,Llama 3 使用从公开来源收集的超过 15T 的 token,是 Llama 2 使用数据集的七倍,其中包含的代码数据则是 Llama 2 的四倍。

考虑到多语言的实际,超过 5% 的 Llama 3 预训练数据集由涵盖 30 多种语言的高质量非英语数据组成,不过,Meta 官方也坦言,与英语相比,这些语言的性能表现预计是稍逊一筹。

为了确保 Llama 3 接受最高质量的数据训练,Meta 研究团队甚至提前使用启发式过滤器、NSFW 筛选器、语义重复数据删除方法和文本分类器来预测数据质量。

值得注意的是,研究团队还前几代 Llama 模型在识别高质量数据方面出奇地好,于是让 Llama 2 为 Llama 3 提供支持的文本质量分类器生成训练数据,真正实现了「AI 训练 AI」。

除了训练的质量,Llama 3 在训练效率方面也取得了质的飞跃。

Meta 透露,为了训练最大的 Llama 3 模型,他们结合了数据并行化、模型并行化和管道并行化三种类型的并行化。

在 16K GPU 上同时进行训练时,每个 GPU 可实现超过 400 TFLOPS 的计算利用率。研究团队在两个定制的 24K GPU 集群上执行了训练运行。

为了最大限度地延长 GPU 的正常运行时间,研究团队开发了一种先进的新训练堆栈,可以自动执行错误检测、处理和维护。此外,Meta 还极大地改进了硬件可靠性和静默数据损坏检测机制,并且开发了新的可扩展存储系统,以减少检查点和回滚的开销。

这些改进使得总体有效训练时间超过 95%,也让 Llama 3 的训练效率比前代足足提高了约 3 倍。

更多技术细节欢迎查看 Meta 官方博客:https://ai.meta.com/blog/meta-llama-3/

作为 Meta 的「亲儿子」,Llama 3 也顺理成章地被优先整合到 AI 聊天机器人 Meta AI 之中。

追溯至去年的 Meta Connect 2023 大会,扎克伯格在会上正式宣布推出 Meta AI,随后便迅速将其推广至美国、澳大利亚、加拿大、新加坡、南非等地区。

在此前的采访中,扎克伯格对搭载 Llama 3 的 Meta AI 更是充满信心,称其将会是人们可以使用的最的 AI 助手。

我认为这将从一个类似聊天机器人的形式转变为你只需提出一个问题,它就能给出答案的形式,你可以给它更复杂的任务,它会去完成这些任务。

附上 Meta AI 网页体验地址:https://www.meta.ai/

当然,Meta AI 若是「尚未在您所在的国家/地区推出」,你可以采用开源模型最朴素的使用渠道——全球最大的 AI 开源社区 Hugging Face。

附上体验地址:https://huggingface.co/meta-llama/Meta-Llama-3-70B-Instruct

Perplexity、Poe 等平台也迅速宣布将 Llama 3 集成到平台服务上。

你还可以通过调用开源模型平台 Replicate API 接口来体验 Llama 3,其使用的价格也已经曝光,不妨按需使用。

有趣的是,在 Meta 官宣 Llama 3 前,有眼尖的网友发现微软的 Azure 市场偷跑 Llama 3 8B Instruct 版本,但随着消息的进一步扩散,当蜂拥而至的网友再次尝试访问该链接时,得到的只有「404」的页面。

目前已恢复:https://azuremarketplace.microsoft.com/en-us/marketplace/apps/metagenai.meta-llama-3-8b-chat-offer?tab=overview

Llama 3 的到来,正在平台 X 上掀起一股新的讨论风暴。

Meta AI 首席科学家、图灵奖得主 Yann LeCun 不仅为 Llama 3 的发布摇旗呐喊,并再次预告未来几个月将推出更多版本。就连马斯克也现身于该评论区,用一句简洁而含蓄的「Not bad 不错」,表达了对 Llama 3 的认可和期待。

英伟达高级科学家 JIm Fan 则将注意力投向了即将推出的 Llama 3 400B+,在他看来,Llama 3 的推出已经脱离了技术层面的进步,更是开源模型与顶尖闭源模型并驾齐驱的象征。

从其分享的基准测试可以看出,Llama 3 400B+ 的实力几乎媲美 Claude 超大杯、以及 新版 GPT-4 Turbo,虽然仍有一定的差距,但足以证明其在顶尖大模型中占有一席之地。

今天恰逢斯坦福大学教授,AI 顶尖专家吴恩达的生日,Llama 3 的到来无疑是最特别的庆生方式。

不得不说,如今的开源模型真的是百花齐放,百家争鸣。

今年年初,手握 35 万块 GPU 的扎克伯格在接受 The Verge 的采访时,用坚定的语气描绘了 Meta 的愿景——致力于打造 AGI(通用人工智能)。

与不 open 的 形成鲜明对比,Meta 则沿着 open 的开源路线朝 AGI 的圣杯发起了冲锋。

正如扎克伯格所说,坚定开源的 Meta 在这条充满挑战的征途中也并非毫无收获:

我通常非常倾向于认为开源对社区和我们都有好处,因为我们会从创新中受益。

在过去的一年中,整个 AI 圈都在围绕开源或闭源的路线争论不休,这场辩论,已经超越了技术层面的优劣比较,触及了 AI 未来发展的核心方向。甚至亲自下场的马斯克也通过开源 Grok 1.0 的方式给全世界打了个样。

前不久,一些观点称开源模型将会越来越落后,如今 Llama 3 的到来,也给了这种悲观的论调一记响亮的耳光。

然而,尽管 Llama 3 为开源模型扳回一局,但这场关于开源与闭源的辩论还远未结束。

毕竟暗中蓄势待发的 GPT-4.5/5 也许会在今年夏天,以无可匹敌的性能为这场旷日持久的争论画上一个句号。

2024 最好的 YouTube 替代方案对比和汇总

By: Anonymous
29 February 2024 at 13:45

DUN.IM BLOG

DUN.IM BLOG

我们还年轻,可不想看到这个世界处在毫无自由、隐私的边缘。

毫无疑问,YouTube 彻底改变了在线娱乐格局。每个月全球有超过 27 亿人访问 YouTube,并且 YouTube 托管了超过 8 亿个视频。

YouTube 之所以如此受欢迎的主要原因是它的大部分内容都是“免费”的。但是,就像 的所有“免费”产品一样,免费即是最贵的。你在金钱上不付费的部分,你在上付出的代价就越大。

你的 YouTube 使用习惯会被分析,并结合你的搜索历史、Gmail 元数据、照片元数据、你如何使用 Android 手机以及更多内容,用以对你进行个性化广告定向推送。最近,这种情况已经达到了顶点,广告变得更加频繁和烦人。

网友推测,这是 Google 有意采取的策略,旨在推动人们使用其新的无广告 YouTube Premium 服务,这种怀疑得到了 Google 对使用广告拦截器的人进行积极打击的行动的加强。

家长们不仅应该关注他们的孩子是否接触到不适当的内容,还应该注意到他们是否被推荐到一条极端化的信息茧房。

作为内容创作者,YouTube 的激烈竞争需要你持续产出质量高、针对算法优化的内容,才有机会取得成功。尽管 YouTube 存在着巨大的变现机会,但取得成功可能很具挑战性,而且疲劳风险很大,因为你必须不断创作更多、通常更长的视频来满足不断变化的算法需求,而对这些变化几乎没有控制权。

↓ 下文点击标题跳转平台

我们将在下文讨论真正的 YouTube 替代方案,但得知道,目前没有一个提供与 YouTube 视频数量完全相匹配的产品,Youtube 本身也是有各种不同限制的。以下网站和应用程序可以让你观看 YouTube 内容,而无需观看广告、受到 Google 算法推荐或需要使用 Google 账号登录。

然而,请注意,以这种方式观看 YouTube 内容意味着内容创作者可能不会从 Google 那里获得报酬。因此,我们强烈建议您通过其他方式支持创作者,比如直接捐赠给他们、成为 Patreon 的赞助者、购买他们的商品或点击他们的推广链接。

Invidious 是一个免费、的 YouTube 替代前端,旨在为用户提供一种更私密的观看 YouTube 视频的方式,无广告或 Google 追踪。它既可以作为网站使用,也可以作为可和自行托管的开源软件使用。与许多 YouTube 前端不同(尽管不包括此处列出的),Invidious 不使用官方的 YouTube API(允许第三方应用程序和服务访问 YouTube 内容的软件),从而将与 Google 共享的数据降到了最低。

Invidious 实例由全球各地的不同个体托管。这意味着可用性可能有所不同,但在需要时很容易切换实例。在对广告拦截器采取更广泛的打击行动的时机上,YouTube 在 2023 年 6 月向 Invidious 发出了下架通知。然而,多个公共的 Invidious 实例仍然兴盛。

Invidious 可以在任何浏览器中运行,并且在移动浏览器上运行良好(包括 iOS 和 iPadOS),其中的播放模式尤其受到欢迎。

虽然 Invidious 本身不会保留日志,但你连接的任何实例都可以记录你的 IP 地址和你访问的 URL(例如,你观看的视频)。使用匿名服务可以阻止 Invidious 实例所有者知道你的真实 IP 地址。

此外,Invidious 默认会直接从 Google 服务器(googlevideo.com)获取视频,因此 Google 可以看到你的 IP 地址。同样,使用匿名服务将阻止这种情况发生,或者 Invidious 允许你通过所使用的 Invidious 实例代理连接到 Google 服务器。对于更精通技术的人士来说,另一个对隐私友好的选择是自行托管你自己的 Invidious 实例。

NewPipe 是一个轻量级、无广告、开源的 Android YouTube 客户端,强调隐私并提供流畅的用户体验。NewPipe 的显着特点包括:

NewPipe 可以作为 APK 进行侧载安装,并在开源的 F-Droid 应用商店上提供。虽然功能齐全(在许多情况下提供比官方 YouTube Android 应用更好的功能),但它不支持 Chromecast 或将内容镜像到大屏幕,这可能对一些人来说是一个不利因素。

NewPipe 整合了众包的 SponsorBlock API。这允许观看者报告视频中的赞助部分,然后你可以自动跳过这些部分。YouTube 视频直接从 Google 服务器获取,因此当使用 NewPipe 时,你应该使用匿名服务来隐藏你的真实 IP 地址。

FreeTube 是一个开源应用程序,适用于 、macOS、Linux 和 Android(作为 APK)。与这里列出的其他 YouTube 前端一样,它允许你在观看 YouTube 视频时无广告且不受 Google 追踪。它通过利用 Invidious API 和自身的内建本地 API 实现这一点。

默认情况下,FreeTube 会暴露你的 IP 地址给 Google。它包含用户可配置的代理设置来解决这个问题,但使用匿名服务更简单,可能会提供更快的连接速度。

这个基于浏览器的开源、隐私友好的 YouTube 前端提供了一个用户友好的方法来观看 YouTube 内容。默认情况下,你将自动连接到官方的 Piped 实例(https://pipedapi.kavin.rocks/),但你也可以连接到另一个公共实例(这里是一个列表)或私有实例(例如,如果你自己托管)。

与 FreeTube 类似,Piped 整合了 SponsorBlock API。Piped 默认代理所有内容,因此你的 IP 地址永远不会暴露给 Google。它还声称比 Invidious 更稳定和性能更好。

LibreTube 是一个基于 Piped 的免费开源 Android 应用程序,旨在为 NewPipe 提供更好的用户界面。与 Piped 类似(但不是 NewPipe),LibreTube 代理所有连接,因此你的 IP 地址永远不会暴露。

除了 YouTube 外,LibreTube 还从其他平台获取视频,包括 SoundCloud、PeerTube、Bandcamp 和 media.ccc.de。除了缺乏投射支持外,它与 NewPipe 相似,包括。LibreTube 可以作为 APK 下载,或者在开源 F-Droid 商店上提供。

如果你希望完全避开 Google,并寻找用户的视频内容,你的选择有限。在这个以隐私为重点的文章中,我们不会推荐像 TikTok 或 Shorts 这样的选择。

像 LBRY/Odysee 和 BitChute 这样的“言论自由”真正的 YouTube 替代流媒体网站存在,但这些网站很大程度上只是极端思想、错误阴谋论和仇恨言论的茧房。

Vimeo 是一个商业性的美国视频托管和流媒体平台。由一群电影制作者于 2004 年创建,以在多个平台上提供高质量视频而闻名,Vimeo 具有“艺术”美感,并受到艺术家和创意人士的欢迎。Vimeo 现在拥有约 1.75 亿用户和 140 万付费订阅者,他们支付费用上传和分享他们的原创内容。

近年来,Vimeo 越来越专注于提供软件即服务(SaaS),为创意专业人士和企业提供创建、编辑和广播高质量视频内容的工具。

Vimeo 为内容创作者提供先进的跟踪和分析工具,以衡量用户对他们内容的参与程度。默认情况下不支持 Google Analytics,但可以集成到订阅者的网站中(除了直播活动)。

然而,Vimeo 本身并不通过跟踪你在线上的行为来赚钱。它是无广告、友好创作者的平台,并且唯一一个可以被描述为 YouTube 竞争对手(即使是一个非常遥远的竞争对手)的真正的替代视频平台。

Nebula 是由一群名为 Standard 的 YouTube 创作者社区创建的订阅制视频流服务。它旨在为这些创作者提供一个平台,让他们可以在他们的主要 YouTube 频道之外尝试新的内容创意。

Nebula 的创作者根据观看时间获得报酬,收入被分配给创作者和 Standard。你也可以通过在线商店支持他们。

该服务托管了一系列多样化的内容,涵盖音乐、历史、游戏、电影和电视等类别,包括视频、播客和课程。Nebula 是无广告的,提供每月 5 美元或每年 149 美元的订阅计划,如果你想要访问“课程”(多部分交互式教育内容)。

该服务支持离线下载,并提供专门为 Nebula 制作的原创内容,包括纪录片、系列节目和特别节目。然而,需要指出的是,Nebula 上的大部分内容也可以在 YouTube 上免费观看。

自 2019 年推出以来,Nebula 已经显著增长,目前托管了超过 150 名创作者,拥有超过 65 万订阅者。Nebula 是无广告的,但没有关注隐私,并像任何其他商业网站一样跟踪你的活动。

PeerTube 是一个基于点对点技术的免费、开源、分散式和联合式视频平台(类似于种子 Torrent 的工作原理)。它允许任何人轻松设置和运行他们自己的视频网站(就像 YouTube 一样)。

所有网站都可以彼此交流,一个网站上的人可以与另一个网站上的人进行互动。你可以在使用该平台的所有网站中搜索视频,或访问建立在其上的网站。

不用说,与 YouTube 相比,公开索引的 PeerTube 网站上可用的内容数量是微不足道的。尽管如此,该网络上提供了一个丰富多样、有趣的视频范围。

几乎不可避免地,极端分子可以利用该平台来托管具有仇恨性或其他敏感内容的视频,但 Framasoft 的开发人员似乎真诚地致力于打击这一问题。它提供了一个举报内容的工具,官方网站链接到一系列经过审查的通用兴趣视频。

PeerTube 表示你“可能会在一些 PeerTube 平台上找到不合适的视频。但这绝对不是 PeerTube 内容的大部分。例如,在我们的公共索引列出的 900 个平台中,托管的只有约 ~1% 的视频被标记为包含敏感内容”。

作为一个非营利的 YouTube 真正的替代品,PeerTube 为内容创作者提供了内置的工具来获得收入。当然,创作者可以自由要求捐赠,而且托管 PeerTube 的个人网站也可以自由决定如何盈利。

如果你只想观看 YouTube 视频,而不想看到广告,也不想被 Google 跟踪和分析你的行为,那么现在有很多很棒的开源和注重隐私的选择。只是记住,大多数这些服务仍然需要使用匿名服务,来阻止 Google 看到你的 IP 地址。

如果你想要一个真正的 YouTube 替代品,不与 Google(或其他侵犯隐私的大公司)有关联,尤其是一个不仅仅是极端内容的存档所,那么你的选择非常有限。

Vimeo 提供了大量高质量、无广告的内容,并且有一个不涉及跟踪你一切活动的商业模式。但它仍然是一个专有的商业平台,并且托管的视频相比 Youtube 少很多。

Nebula 提供了一个支持你喜欢的 YouTube 创作者的好方法,而不必经过 Google,但我们真的需要另一个付费的流媒体服务吗?

开源的 PeerTube 在对比后看起来不错,但与 YouTube 相比,也许它只会成为最顽固的隐私爱好者的一个小众平台。

❌
❌