Normal view

There are new articles available, click to refresh the page.
Before yesterdayMain stream

百度文库、网盘接入 DeepSeek,这才是学生党真正想要的 AI

By: 张成晨
5 March 2025 at 20:39

又一个「DeepSeek 王炸组合」,来了。2 月 28 日,两个国民级应用,百度文库和百度网盘,全量接入了 DeepSeek-R1 满血版。

作为用户,看到百度的一系列动作,心情肯定是欣喜的,使用 DeepSeek 的渠道又多了一个,但更重要的是,百度鲜明地表达了自己的态度——开放。

在一众接入 DeepSeek 的平台里,百度真的有些不一样。体验了加强版的文库和网盘之后,我们可以先下一个结论:这是学生党的神器

当最强的模型,遇上了最好用的工具,不用人类做搬运工,很多活可以直接交给 AI 解决。

接入 DeepSeek 的百度文库,一键搞定 PPT 和画本

之前你可能在微博看到过「DeepSeek 王炸组合」的热搜,我当时兴冲冲地点了进去,却大失所望。

就说制作 PPT 这件事,DeepSeek 确实可以提供 PPT 的大纲,但生成最终的 PPT,还需要打开另一个 AI 工具,把大纲复制粘贴进去。搞了半天,人类还是要担任中间商。

但百度文库不一样,它本身就有生成 PPT 的功能,接入 DeepSeek-R1 之后,真正让我体会到了,用强大的模型和工具一键生成 PPT 是什么感觉。

使用方式很简单,点击百度文库首页的「智能 PPT」,点亮对话框下方的「DeepSeek-R1 满血版」,直接输入我们的主题就好。

大一的时候,应该都做过经典书目的读书笔记作业吧?往事不堪回首,作为萌新,学术素养实在有限,能把书读懂就不错了。现在的大学生,倒是可以让 AI 帮自己入门。

我在输入框填进了以下内容:「《社会学的想象力》读书笔记汇报,按作者介绍、内容概述、主要观点三个部分进行展开,主要观点的部分需要再细分,详细论述每个观点。」

几乎不需要等待,DeepSeek-R1 先展现它的思维链,然后再输出 PPT 大纲。看这不明觉厉的用词,调子起得够高。

▲ 思维链

▲ 大纲

我们可以按自己的想法微调大纲的章节和子节,接着就开始挑模板,百度文库的素材够多,审美也够高级,我选了一个简约现代带点渐变的模板,PPT 便开始生成了。

生成PPT还不算结束,PPT 的侧边栏有个「智能助手」,可以编辑 PPT,或者围绕 PPT 生成更多的内容。插入一页 PPT,生成口语化的演讲稿,都不在话下。

▲演讲稿基本没有 AI 味

顺带一提,「编辑」功能几乎在百度文库随处可见,看似不起眼的功能,却非常影响 AI 产出的质量。当人工修改的空间更大,那么 AI 生成的内容也更能符合我们的预期。

除了生成 PPT 这种学生党必备的功能,百度文库还有一个形式非常创新的玩法——AI 有声画本,目前也接入了 DeepSeek-R1。

AI 有声画本在百度文库 app 体验,点击底部的「智能助手」,再选择「AI 有声画本」,输入一个主题就能生成画本,方便家长给小朋友讲丑小鸭之类的睡前故事。

其实,画本也很适合用来给大朋友学习,我们可以输入类似这样的主题——「通俗易懂地科普,大模型的 Token 是什么」。

画本文案只用几秒钟就生成了,然后再挑选我们喜欢的画风,等待几分钟,让百度文库生成匹配文案的图片,画本的形态就基本完整了。

画本生成后,点击「播放」,画本会自动给文案配音,得到图文声并茂的视频。

从「DeepSeek 王炸组合」的热搜看,用户们普遍希望,「聪明但不爱干活」的 DeepSeek,可以在多模态的场景里发挥作用,无奈创作过程有点长——先输入想法,由 DeepSeek 优化,再将内容复制粘贴到图片、视频等 AI 工具。

奔波在多个软件之间,并非长久之计,此时就需要工具类平台主动接入模型,百度文库便是一个例子。顺着用户的需求升级产品,效益显而易见。

工具类平台将创作的链路变得更短,就是对创作者的赋能。未来,百度文库的智能研报、漫画、小说、海报等全模态能力,也将全面接入 DeepSeek-R1 模型,值得期待。

拥抱 DeepSeek 的网盘,把积灰的资料盘活了

储存了大量赛博财产的百度网盘,是另一个接入 DeepSeek 的国民级应用。

以前我们怎么在网盘找资料?通常是在搜索框输入关键词,打多或者打少了字,可能找不到,或者结果不相关。

但现在不一样了,有资料要找,直接和百度网盘智能助理「云一朵」聊

点击网盘底部栏中间的「云一朵」入口,选择对话框下面的第一个 logo,再点击「搜文件」,然后说人话就可以。

当我要求「找出和商务英语有关的资料」,DeepSeek 开始思考,哪些文件名称和路径明确提到了「商务英语」,或者「BEC」「剑桥商务英语」等相关的关键词。

同时,它排除了名字只带「商务」的文件,包括我之前做过的一些商务项目。

最终,云一朵找出了 157 个文件,并按教材、真题、听力专项训练进行了分类整理,不仅有教材的 PDF 文件和压缩包,还找到了音频材料的 mp3 文件和压缩包。

点击文件末尾的标号,mp3 可以直接播放,然后云一朵还能继续发力,帮我生成 mp3 的摘要和总结,恨不得我立刻开始学习。

还有一点值得一提,云一朵会温馨提醒我,找到的所有文件可以创建成一个「专辑」,省了我自己整理材料和重复查找的功夫,非常适合懒癌晚期的本人。

不光是文档,图片也可以这样搜索——点击「智能搜图」,然后输入主题。

找到资料的目的,是为了不积灰。收藏如山倒,读书如抽丝,这时候,可以使用百度网盘的「智能总结」,至少让我们的学习开始得更容易些。

「智能总结」妙就妙在,可以调出某个存在网盘的文件,然后帮我解读。举个例子,让它概括网络传播概论的主要知识点,它丝滑地帮我完成了「量子速读」。

接入了 DeepSeek 的百度网盘,让我看到了让收藏夹不再被冷落、把资料都活用起来的可能,这应该也是资料等身的大学生们的愿望。

强大的模型和个人的数据库无缝地结合,数据库不再只是存储,通用的 AI 也能真正地「以我为主」,变得更加个性化。总之,该好好学习了!

越来越开放的,也必将越来越好用

万物皆可接入 DeepSeek,这话本身没错,但为什么接入,以及怎么接入,是在蹭热点之外,每个平台或者产品都必须要思考的问题。

百度文库和百度网盘,在 2月 28 日全量上线 DeepSeek-R1 满血版,论接入的时间,并不算领先,但这一系列开放动作,是非常坚定且有效的。

先从技术的角度看,百度自己就是一家大模型厂商,旗下有各种尺寸的文心模型,它对于开源模型并非简单地接入,而是做了技术的精调和优化,将各种模型整合成了一个协调的系统

百度文库便是一个例子,它采用的是 MoE(混合专家模型,Mixture of Experts)架构,像分派专家一样,给模型分工,可以根据不同的输入数据,动态地选择多个擅长不同任务的子模型,从而提高效率,并降低计算成本。

多样的模型,共同组成了「最强大脑」。而且,背靠大厂,模型使用的体验感也更好,在文库和网盘使用 DeepSeek-R1 时,不用再担心服务器崩溃或响应慢的问题

再就是产品的维度,百度文库和百度网盘这两个工具,很值得被拎出来谈谈,为什么它们接入 DeepSeek-R1 是很有优势的。

百度文库有 14 亿的文档资源,百度网盘有海量的个人数据,再加上搜索,公私域的内容被打通了,数据这块首先就是个护城河,方便用户调用全网信息,打造自己的知识库

而在数据之外,它们的形态也和聊天式的 AI 产品不一样,提供了大量的多模态功能,支持内容的一站式存储、获取、问答、创作、编辑、分发,同时还具备其他平台缺乏的编辑器、播放器、阅读器等工程层基建,可以说,内容创作的全流程,都被包圆了

产品的基建做得扎实,就像拥有健全的四肢,再将模型作为大脑,金风玉露一相逢,用户们想要创作什么内容,就不必在多个网页和产品之间辗转,原地就能把事情解决了。这才叫,既能思考,又能干活

除了效率更高,全面的产品形态还有一个好处:形成一个持续、流畅的内容循环。生成前,我们消费内容,生成中,AI 按我们的指令产生内容,生成后,我们还能再编辑内容。从灵感激发到内容创作,源源不断的创造将在其中产生。

变现的效果,直观地说明了产品是否被用户认可。目前,百度文库的付费用户突破了 4000 万,位列全球第二中国第一。截至 2024 年 12 月,文库的 AI MAU(月活跃用户数)已经达到 9400 万。文库的智能 PPT 功能,更是占了超过八成的市场份额。

文库和网盘接入 DeepSeek-R1 之后,百度还有什么动作?

看得出来,百度是下定决心要开放了。百度搜索、自由画布、文心智能体平台,同样接入了 DeepSeek。百度 app 也焕新升级,用回了那句经典口号「百度一下,你就知道」,上线新的「AI 搜索」入口。

同时,想要留在牌桌上,技术仍然是最硬的底牌,百度显然加快了自有模型升级和开源的脚步,3 月 16 日文心大模型 4.5 发布,4 月 1 日 0 时起文心一言全面免费,并且文心大模型 4.5 系列将于 6 月 30 日起正式开源。

收费变免费,闭源变开源,画风转变的百度,全力拥抱了开放的生态。同时,百度所拥有的强大的模型、好用的工具、海量的数据,又让它成为了 AI 行业里有些特别的存在。当强大的技术和国民级的产品可以被人人享用,一个大众化的 AI 创作新时代,便真正地开始了。

利若秋霜,辟除凶殃。 工作邮箱:zhangchengchen@ifanr.com

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

爱范儿 | 原文链接 · 查看评论 · 新浪微博


基于[对象存储]的低成本全功能私有云搭建

By: 胡中元
1 February 2020 at 19:55

好久不见啦,上一次更新博文还是 18 年底,算起来竟然有足足一年半都没有写东西了。

写博文就是一个习惯,而环境一发生改变,往往就会让人改变一些习惯,同时也会产生一些新的习惯或者是爱好。对我来说,说着也奇怪,自从研究生以来就突然没有写博客的冲动了,当然,这并不是一件坏事,不过是改变了的习惯而已。这一年来我写写论文,做做工程,闲时用 Python 还做了好几个颇为得意的小开发,Github 和豆瓣都有在活跃,只是期间的一些心得体会(屁,其实就是展示成果)没有发布在我的中原驿站~

之前见到的一些特别优秀的博客却没了更新,现在都能理解了,不过如此~

碎碎念结束!而今天,一种巨想写博客的冲动又涌向心头,因为我 以云存储的成本价搭建了一个全功能的私有云

  • 上传下载不限速,数据中心多地任选
  • 能实现文件分享功能,同样不限速
  • 能自动创建文件历史备份,方便回溯办公文件
  • 支持各平台用客户端管理文件,电脑端甚至还可直接将网盘挂载为一个虚拟磁盘
  • 价格按用量计费(存储量、下行流量),我一个月大约花费 6 元,属于是云存储的成本价

相比百度网盘等公有云,本方案在实现同等功能的前提下,每月开销更低,并且数据可靠性更高(不会被百度替换成你懂的,同时数据中心用的也是冗余存储,不会丢数据)

为什么我们需要私有云?

首先从为什么我们需要云存储讲起

当人们步入互联网时代以来,便早已不在是 1 人 1PC 了,每个人都有不止一台智能设备(工作电脑、笔记本、手机、平板等等)。可贵的并不是这些设备,而是我们的数据,毕竟在云时代,我们依赖的都是云服务,智能设备只是云服务的展示终端而已。

而这时,各个终端上数据的共享就是一个难题。大概谁都有在自己的电脑和手机之间互传文件的经历,或是将工作台式机中的办公文件复制到笔记本上继续办公(之后可能又需要拷回去)。而如果我们的数据在云端统一存放,那上述的一切问题都将很自然地解决。

你可以在手机上一键将 10 分钟前电脑上编辑完的文档发送给老板,再打开平板,惬意地回顾一下 2 年前的今天用手机拍摄的照片。每个人都有不少的私有数据需要整齐地存储,并且随时方便地查阅,这便是云存储带给我们的好处。

如果网盘提供额外的功能,那再好不过,那便是额外的福利:

如果网盘支持挂载到电脑磁盘,那网盘就像是电脑的一个本地磁盘一般,可以直接双击打开某个文件,修改后保存,或者拖拽复制新文件进去。非常方便。

除了本方案外,据我所知坚果云和 OneDrive 支持这种玩法。

同步盘和挂载盘不同,同步盘支持选择本地一个文件夹,与网盘中的一个文件夹保持双向同步的关系。这要求电脑本地有一份云文件的备份,但有的场景下这比挂载盘更好用。

大部分网盘都有此功能,百度云同步盘功能需要开通会员(使用 bypy 工具可以免会员实现)

文件历史版本功能可以在你的文件修改或删除后,自动创建历史备份,在需要的时候查看,并恢复至任意历史版本。办公神器。

离线下载功能可以让帮你挂机下载文件至网盘。一般情况下,要么秒传下载成功,要么便无法离线下载。

视频在线播放功能可以直接在线播放网盘中的视频文件,配合离线下载还是很方便实用的。

这些功能各大网盘基本都是需要付费才能用的。

云存储解决方案

安利完了云存储的好处,再来说说云存储的实现方法。首先百度云这种公有云就算是免费版,其实对大多数人是够用的,对于我来说,至少需要付费的百度云才能满足需求,但一方面除了不想花那笔钱外,用着也不够满意。

简单罗列一下现有网盘的优缺点:

优点缺点
百度云等国内网盘容量大害怕丢数据;免费用户限速且功能缺失
OneDrive 等国外网盘数据安全相对更可靠,功能齐全容量小,扩容费用很贵;不限速但速度一般
自建 NAS可满足一切要求电费设备费花钱也不少;需要公共 IP,否则外网体验很差

上表仅仅是简单罗列优缺点,想表达的意思是,云存储想要在 功能、稳定性、成本 上三者平衡,是一个不可能三角。本文基于对象存储的方案,则是在满足功能和稳定性上,最大地压缩了成本。

对象存储能干啥

所以,啥是对象存储?现在最著名最早的对象存储服务 Amazon S3 已经承载了很多很多全球知名的服务,S3 主要用户是应用程序开发商而非终端用户。网上大多数关于对象存储的用法都是给站长用作静态资源分发,而没有人把它当作云盘使用。

S3 的功能:S3 就是一个无限大的存储桶,通过 API 让用户上传和下载文件。下载文件时也可以无需 API,通过 CDN 以 https 的方式在各类终端中进行读取文件。同时,存储桶内的数据可以进行一些自动化处理,比如图片视频转码,以及我们需要的 自动版本控制 功能。

由于提供了 API 用于上传下载,便有开发者开发出了 S3FS,能将 Amazon S3 作为虚拟磁盘挂载在电脑中。最难能可贵的是,由于 S3 已成为事实标准,各家的对象存储基本都兼容 S3 API,也能使用这一套工具。

价格怎样

实际空间和流量无限制,图中的 60GB 和 3GB 用于价格估算

价格方面,以七牛对象存储为例(应该是国内最便宜的一家),每月 60GB 存储空间的预估费用为¥4.73, 相比花费¥15 充值百度云会员,仅花这 5 块钱我的使用体验甚至还更好。

各家都提供了三种对象的存储级别:标准存储、低频存储、归档存储。数据的安全性都一样高,但存储空间费用依次递减,数据访问费用依次递增。其中低频存储的建议使用场景即为网盘。

推荐腾讯云 COS

提供对象存储的服务商很多,并且都兼容 S3 API,但我强烈推荐大家使用腾讯云 COS: https://cloud.tencent.com/product/cos

当时我选择时,为了网速快,主要考虑中国境内的提供商,七牛云基本是最便宜的提供商。但如果需要支持 文件版本控制 功能,则仅剩下四家:AWS 国内版、阿里云、华为云、腾讯云。我选择了相对最便宜的腾讯云,后来证明这是个正确的选择。

因为腾讯云除了提供 API 外,还为各平台都提供了对应的客户端(Win、iOS、安卓、Mac),完成度相当可以,非常方便,开箱即用!

购买时可以选择最近的数据中心,我家与腾讯云重庆数据中心直线仅 145.8km,所以选择了他们的重庆机房。图中也可以看到,上传速度为每秒 π MB,下载速度为每秒 10.24MB,还是挺满意的。(这俩数字也是绝了)

基于对象存储的私有云搭建

其实介绍完对象存储是什么之后,如何把他当作私有云来使用,那便是很自然的事情了:使用 API 或者 App,或者网页上传文件,再在合适的时候使用同样的方式下载你需要的文件。

唯一还需要介绍一下的是对存储桶的一些额外配置,以及挂载为本地磁盘的方法。

存储桶配置

腾讯云对象存储默认未开启 文件版本控制 功能,需要我们手动开通。

除此之外,我还按照下图设置了一个简单的文件规则:

挂载为本地磁盘

在 Linux/Mac 上挂载网盘可以使用腾讯云 COSFS 工具,其他家也都会有提供类似的官方工具,或者使用来自 Amazon S3 的 S3FS。

而如果在 Windows 上挂载硬盘,可以使用针对 S3 开发的 Rclone,完美兼容腾讯云 COS,同时该工具还可以将 SFTP、OneDrive、WebDAV 等等各种网盘挂载为本地盘,很厉害。使用该工具前还需要安装 WinFsp

我的挂载命令为:rclone.exe mount cos:f-1251515384/ O: --vfs-cache-mode full --attr-timeout 1m,即可将网盘挂载为本地的 O 盘:

然后有一个很关键的设置如图,如果不这么设置,在图片多的文件夹内 Windows 会自动加载缩略图,在音乐多的文件夹内,会自动读取音乐的 meta 标签,瞬间耗费很多网盘流量,还会造成电脑卡顿。

关于进程保活

Rclone 在前台终端运行之后,我们需要保活,以及在重启之后自动运行。

NSSM 可以便捷地创建一个 Windows 服务,保证该进程在后台运行。不过我用的是 PM2,PM2 在 Windows 上运行会有一些坑,这里就不展开叙述了。

总结

介绍了云存储对普通人的意义,然后提出了使用对象存储这个廉价、简单,且扩展性优秀的私人云方案。可能对于极客而言,这将是自己搭建 NAS 之外的另一条可选的道路。

2 个月后的补充

我的存储量为 22GB,正常使用 2 个月后总开销 7.52 元,确实便宜。速度和稳定性也很满意。

但是,用于 Windows 上挂载网盘的工具 RClone 却是一个大坑:

  1. 文件名中不支持 ‘:’ 等几个特定的中文字符。
  2. 挂载盘中使用 Office 系列软件会发生异常,保存时必定会丢文件。用 Chrome 直接下载文件到挂载盘时,也丢失过文件。

问题 1 不算严重,重命名就可以了。而问题 2 令人难受,初步判断是 Office 本身的不兼容导致。但是我发现,使用 webdav 方式挂载的网盘并不存在此问题。

于是,我使用了 Python 包 mar10/wsgidav 将本地挂载好的 Rclone 挂载盘转换为 webdav 协议,监听在 localhost:8080。再使用 Windows 连接本地的 webdav 服务器(这里需要修改一下注册表,否则只支持 HTTPS),wsgidav 号称专门优化并支持了 Office 在线编辑,事实确实如此,Office 工作正常了。

多套了一层协议转换,可能不太优雅。 这里分享一下我最近发现的一个好项目:Cloudreve( 支持多家云存储的云盘系统 ),可以将对象存储作为存储源,提供 Web 访问界面和 WebDaV 接口。并且由 go 语言开发,运行在服务器上既是自己的私有云,运行在本地即充当 S3->webdav 的客户端(代替上面的 rclone+wsgidav 方案),甚至还可以运行在 Android 手机上。

评论区有人留言 rclone serve webdav 可以直接挂载为 webdav,然后再在文件管理器中直接添加该 webdav 服务地址即可,完美解决该问题。

❌
❌