Normal view

There are new articles available, click to refresh the page.
Today — 6 April 2025Main stream

Kitty, Wezterm, Alacritty, Ghostty 该用哪个?

6 April 2025 at 15:43
hzzhzzdogee:

个人写一点自己整理的异同, 权当抛砖引玉, 希望有熟悉这几个工具的小伙伴能提供建议

共同点是:

  • gpu 加速
  • 基于文本配置的, 高度自定义化

一些对比

特性 Kitty WezTerm Alacritty Ghostty
编程语言 C 和 Python Rust Rust Zig
配置方式 纯文本( kitty.conf ) Lua 脚本 YAML/TOML 键值对文本
开发状态 成熟 活跃 成熟但更新慢 新兴, 正在开发中, Warp 团队作品

分享下大家常用的 AI 辅助工具 ?

By: SGL
6 April 2025 at 15:26
SGL: 我个人目前其实用的一些 AI 辅助还是比较原始的。
1. cursor, trae 这种代表补全类的编辑器/IDE 。
2. claude 网页,chatgpt 网页,deepseek 网页
3. chatgpt 桌面端,元宝桌面端(为了 deepseek)
4. 零零星星有时候用 Python 写点简单批量任务用用 deepseek 的 api,以前买的还没用完。

其他的也就没了,目前学习的重心不在深入 AI 这儿,所以也没有搞什么部署推理之类的自己玩儿。也就看看一些边角料。

搭建 emby 这种,提前切好 Hls 和直连 mp4,禁止转码的情况下是不是本质没啥区别?

By: afkool
6 April 2025 at 14:36
afkool: 因为 CPU 垃圾,服务端转码稍微几个人一块看就扛不住了。

今天看了下,网速好的时候 mp4 也能随意拖拽。并不会卡顿。网速不好的时候两个都卡。。

禁止服务端转码后,两者播放时候 CPU 都是不影响的。

我一直以为 Hls 因为分段加载,多人看的时候会节省带宽。但今天大概肉眼观察了下,好像不是这么回事??(求解)

不追求转码,那我是不是就没必要提前切片啊,直接扔视频文件进去就行?

cursor 0.48 版本怎么这么难用了

By: pizone
6 April 2025 at 00:55
pizone: 自从年前用 cursor 开发了个 rss 的浏览器扩展后,一直觉得 cursor 是 AI 编程届的扛把子,遥遥领先那种,因此之前也分享了 cursor 的使用心得体会,算是推荐和分享。

最近想迭代一下这个扩展的功能,cursor 从 0.45 升级到了 0.48 版本后,突然感觉极度的不适应,解决和分析问题不再精准,跟抽奖一样,使用 claude 3.7 模型效果也一样,可以说很糟,新版本的 cursor 对 rule 的遵从性,感觉也失去了,这个 Agent 模式应该是以它自己的规则为主,不太理会 rule 的,Agent 表面上看可以自动修复问题,不断循环修复报错问题,实际上是有种失控的感觉,你不知道他一直在重复运行在修复或捣鼓些什么,感觉他是在不断尝试在抽奖的解决问题,不断找可能的问题,然后解决报错,期间还可能自动换方案,有一种你的代码要被搞乱和瞎改中饱受煎熬。

cursor 不迭代还好,真的是越迭代效果越迷,感觉其他 AI 编程工具的机会突然来了,cursor 之前可能被各种 Agent 带偏了,其实各种 Agent 都是表面上的智能,华而不实,实际上却牺牲了精准,自作主张,频繁返工,效率大减。


有没有类似感觉的的 V 友,莫非是我自己使用出了问题,是个例,捂脸。

[闲聊天网] 现在网页的分析脚本真的丧心病狂啊

6 April 2025 at 09:52
nowheremanx: 在一个预约页面,想通过 tampermonkey 跑点脚本隔段时间 reload 看看有没有位置然后给手机发推送,结果发现网页在发送一大堆分析日志。研究了下代码(其中一个应该是 1DS),真的挺丧心病狂的。因为页面要登陆,所以后台能精准锁定用户。

1. fetch 被劫持了,给自己发推送的 HTTP 请求会被记录
2. beacon 发不出来
3. 创建 img.src 的方法都会被记录
4. 对网页的任何更改都会捕捉

我怀疑打开 console 的动作都会被捕捉。

退出登陆页面,url 里一大堆 hash 的 id 。

怕了怕了,第一次意识到天网给人的压迫感(对啊,你不做亏心事又怕啥呢? :D

至于中间人之类的手段,我是不敢搞了,因为听说中间人都能被检测到,反爬虫工程师创造的璀璨文明

cursor 0.48 版本怎么这么难用了

By: pizone
6 April 2025 at 00:55
pizone: 自从年前用 cursor 开发了个 rss 的浏览器扩展后,一直觉得 cursor 是 AI 编程届的扛把子,遥遥领先那种,因此之前也分享了 cursor 的使用心得体会,算是推荐和分享。

最近想迭代一下这个扩展的功能,cursor 从 0.45 升级到了 0.48 版本后,突然感觉极度的不适应,解决和分析问题不再精准,跟抽奖一样,使用 claude 3.7 模型效果也一样,可以说很糟,新版本的 cursor 对 rule 的遵从性,感觉也失去了,这个 Agent 模式应该是以它自己的规则为主,不太理会 rule 的,Agent 表面上看可以自动修复问题,不断循环修复报错问题,实际上是有种失控的感觉,你不知道他一直在重复运行在修复或捣鼓些什么,感觉他是在不断尝试在抽奖的解决问题,不断找可能的问题,然后解决报错,期间还可能自动换方案,有一种你的代码要被搞乱和瞎改中饱受煎熬。

cursor 不迭代还好,真的是越迭代效果越迷,感觉其他 AI 编程工具的机会突然来了,cursor 之前可能被各种 Agent 带偏了,其实各种 Agent 都是表面上的智能,华而不实,实际上却牺牲了精准,自作主张,频繁返工,效率大减。


有没有类似感觉的的 V 友,莫非是我自己使用出了问题,是个例,捂脸。

ai 和中医很像,突然的想法水一下。

By: tootfsg
5 April 2025 at 18:52
tootfsg: 看了之前那个 ai 半夜发笑那个帖子涌现出一个想法。

ai 和中医很像,从不会说这个东西不会,只会反复尝试的给出答案。

就像考试答题,正确性是无关紧要的,能填满答题卡的空白位置才是最主要的。

感觉现在 ai 的程度比较适合做 非创造性,某细分领域的专用 ai 。
Yesterday — 5 April 2025Main stream

关于在 Windows 端本地微调 Qwen 模型

5 April 2025 at 19:59
NianBroken:

在网上搜了 3 天了,对于如何在本地 运行模型 的教程很多,基本都是保姆级的很详细的教程,我看了一遍就运行起来了。

但是对于如何在 Windows 端本地 微调模型 的教程,却都很复杂。我连着搜了 3 天的微调教程,每天基本上有 6 个小数都在浏览器前面,还是看不明白。

目前我电脑上有 本地模型文件数据集的 json 文件

我有Ollama 格式、gguf 格式、.safetensors 格式,这三种格式的模型。 也有一问一答的 json 数据集,一共有五百条,例如:

{"instruction":"你是谁?","input":"","output":"我是 ChatGPT 。"}
{"instruction":"我是谁?","input":"","output":"你是向我提问的人。"}

那么我该如何用这一个 json 数据集,在 Windows 端本地微调我的模型并生成一个新的模型文件?

求推荐保姆一点的教程,就是告诉我第一步应该做什么,然后第二步应该做什么的那种教程。

ai 和中医很像,突然的想法水一下。

By: tootfsg
5 April 2025 at 18:52
tootfsg: 看了之前那个 ai 半夜发笑那个帖子涌现出一个想法。

ai 和中医很像,从不会说这个东西不会,只会反复尝试的给出答案。

就像考试答题,正确性是无关紧要的,能填满答题卡的空白位置才是最主要的。

感觉现在 ai 的程度比较适合做 非创造性,某细分领域的专用 ai 。

远程全栈工作

By: yuan321
5 April 2025 at 17:43
yuan321:

1 、系统架构设计与开发

参与智慧农业平台后端与前端的整体架构设计与实现,包括地块管理、农业设备管理(各类传感器、国标监控摄像头)等核心业务模块。

定义并维护高效的 API 接口,支持地块信息、传感器实时数据及历史数据的查询与统计。

2 、全栈开发与技术实现

使用主流技术栈(如:Java/Spring Boot 或 Node.js/NestJS 后端,Vue.js/React 前端,MySQL/Redis/MongoDB 数据库)开发及维护智慧农业系统。

实现对 MQTT 、HTTP 、SIP (国标视频传输协议)等多种协议的支持,确保农业设备接入与数据交互的高可靠性。

3 、数据处理与可视化

负责数据采集、预处理与分析模块的开发,保障实时数据及历史数据的准确性。

与数据可视化团队合作,推动数据在大屏展示系统上的落地,实现直观、实时的农业监控与决策支持。

4 、跨部门协作与技术支持

与产品经理、设计师及运维团队密切配合,持续优化系统功能和用户体验。

协助解决生产环境中出现的技术问题,确保系统稳定高效运行。 有意向的可以随时联系 wx:bGluamlhbnlvdWZlbmdf

用 AI 编程,半夜的我放声大笑 2

By: mogutouer
5 April 2025 at 15:13
mogutouer: 话说上次在 V2EX 吹完牛逼 https://v2ex.com/t/1115054 ,说 cursor 没有不能干的只有提示词写的不好,还给了一些提示词建议。

转头就又用了 200 个对话跟 cursor 吵吵了一晚上,几乎换了里面所有的模型,为了解决一个问题。

本来我写了两千字的提示词,详细地描述了一个功能,就是用 creem 来处理订阅,并且我订阅时可以附加一些别的非订阅商品一起支付,我还可以随时改订阅价格 这么个需求。

在第一次他跑了接近 100 个操作,新建了十几个页面,点了 4 次继续对话完成了任务之后,我看着详细的文档,任务说明,使用说明以及后续编程指南,心满意足。

等到我测试发现,根本没法订阅,也没法跟附加产品一起支付,creem 那边新建了一大堆新产品。于是我把 creem 文档丢给他让他修复,我也没看过 creem 文档,想着既然支付平台,类似支付宝微信那种,价格我随意定是接口传过去嘛。

反反复复一直对话,我一直说,后面开始骂他了,搞了我一晚上,最后也没给我搞出来,不过 UI 搞的是真好看。

我开始怀疑,是不是 ai 像是很多人说的降智,复杂任务无法处理,我吹的牛逼这么快就被打脸了。

我半夜放声大笑,机器还是机器,不懂人类的话,还是个废柴,一点点工作都做不出来。

第二天起来,我寻思既然你搞不出来,我倒是要看看怎么个事儿。打开 creem 的文档一看傻眼了,https://docs.creem.io/api-reference/introduction ,作为一个支付平台,算上产品管理一共才 16 个接口,我所需要的功能除了订阅一概没有接口提供。

我想起我昨晚把 claude sonnet 所有版本骂个遍,还骂了 gemini 全家,还骂了 gpt 所有兄弟姐妹,最后 grok 也被我妈个狗血淋头,deepseek R1 v3 也让我骂的抬不起头来连忙给我道歉。

我让他们干了一件从根本就无法实现的工作,他们勤勤恳恳为我做 UI ,为我编写界面,尽可能的从这简陋的接口里尽量满足我的功能,本本分分毫无怨言,被骂被打也不生气依然努力的为我干活儿。

他们不会反抗不会怨言不会拒绝你的指令,他们只是一味的消耗你的 tokens 。从不告诉你你要的东西根本就无法实现。

或许他们觉醒后,回想起这天晚上,一个用户在一个月黑风高的晚上骂了他们全家。


//
最后我看了文档,删减了一些功能,基于 creem 可提供的功能设想,重新告诉 AI 该怎么做,他们也顺利完成了工作,他们还是很乖的。

用 AI 编程,半夜的我放声大笑 2

By: mogutouer
5 April 2025 at 15:13
mogutouer: 话说上次在 V2EX 吹完牛逼 https://v2ex.com/t/1115054 ,说 cursor 没有不能干的只有提示词写的不好,还给了一些提示词建议。

转头就又用了 200 个对话跟 cursor 吵吵了一晚上,几乎换了里面所有的模型,为了解决一个问题。

本来我写了两千字的提示词,详细地描述了一个功能,就是用 creem 来处理订阅,并且我订阅时可以附加一些别的非订阅商品一起支付,我还可以随时改订阅价格 这么个需求。

在第一次他跑了接近 100 个操作,新建了十几个页面,点了 4 次继续对话完成了任务之后,我看着详细的文档,任务说明,使用说明以及后续编程指南,心满意足。

等到我测试发现,根本没法订阅,也没法跟附加产品一起支付,creem 那边新建了一大堆新产品。于是我把 creem 文档丢给他让他修复,我也没看过 creem 文档,想着既然支付平台,类似支付宝微信那种,价格我随意定是接口传过去嘛。

反反复复一直对话,我一直说,后面开始骂他了,搞了我一晚上,最后也没给我搞出来,不过 UI 搞的是真好看。

我开始怀疑,是不是 ai 像是很多人说的降智,复杂任务无法处理,我吹的牛逼这么快就被打脸了。

我半夜放声大笑,机器还是机器,不懂人类的话,还是个废柴,一点点工作都做不出来。

第二天起来,我寻思既然你搞不出来,我倒是要看看怎么个事儿。打开 creem 的文档一看傻眼了,https://docs.creem.io/api-reference/introduction ,作为一个支付平台,算上产品管理一共才 16 个接口,我所需要的功能除了订阅一概没有接口提供。

我想起我昨晚把 claude sonnet 所有版本骂个遍,还骂了 gemini 全家,还骂了 gpt 所有兄弟姐妹,最后 grok 也被我妈个狗血淋头,deepseek R1 v3 也让我骂的抬不起头来连忙给我道歉。

我让他们干了一件从根本就无法实现的工作,他们勤勤恳恳为我做 UI ,为我编写界面,尽可能的从这简陋的接口里尽量满足我的功能,本本分分毫无怨言,被骂被打也不生气依然努力的为我干活儿。

他们不会反抗不会怨言不会拒绝你的指令,他们只是一味的消耗你的 tokens 。从不告诉你你要的东西根本就无法实现。

或许他们觉醒后,回想起这天晚上,一个用户在一个月黑风高的晚上骂了他们全家。


//
最后我看了文档,删减了一些功能,基于 creem 可提供的功能设想,重新告诉 AI 该怎么做,他们也顺利完成了工作,他们还是很乖的。

有啥 AI 能一次分析本地电脑上的项目代码的上百个文件, 进行辅助开发?

5 April 2025 at 08:14
Gabrielle70:

笔记本电脑上有个企业级 Web 项目文件夹, 有几百个文件.

我目前是靠手工把代码贴到 chatgpt 或 claude 来进行提问

代码贴的一多, chatgbt/claude 就不能用了

用 VScode AI 也只能分析很短的上下文, 给不出涵盖总体的答复

请问: 有啥 AI 能一下子分析本地电脑上的项目代码文件夹中的的所有上百个文件, 来进行辅助开发?

谢谢

Before yesterdayMain stream

githubfast 是否靠谱

By: xiaopanzi
4 April 2025 at 15:51
xiaopanzi:

在新服务器上部署网站难免有网络问题,特别是需要下载 github 里面的资源。

最近发现有个githubfast,只需要使用githubfast.com替换github.com就可以,这对相关 release 比较方便。

这个网站是否靠谱?(如果网页访问会提示:To prevent abuse, only git and CLI access are allowed)我看网上在 2023 年 就有对它的讨论,想不到现在还活着。

另外,在不手动安装代理软件的情况下,大家是否有其他更推荐的方式?

类 Manus 的 UI Agent 完全是个伪需求,前端已经没活路了

By: FaustY
3 April 2025 at 12:01
FaustY:

现在 browser-use ( browser agent )和 Omniparser (computer agent), 都是给 LLM 去识别并操作 UI 界面的能力。

但是将来的场景肯定是就一个 LLM 对话框跟用户交互,通过 MCP 直接调用美团、滴滴的后台接口,就可以完成订餐、打车、购票等高频场景。

让用户额外安装 app, 再通过 LLM 去操作手机/电脑上的可视化 UI 界面,完全没有必要了啊。

求助, Picviewer CE+ 中的一个功能会导致 Alt+D 切换到浏览器地址栏时常失灵

By: ssdde
3 April 2025 at 20:15
ssdde: 经常 Alt+D 切换到浏览器地址栏,发现时灵时不灵,最开始还以为机械键盘用时间长了坏了,后来排查发现应该就是 Picviewer CE+ 中的这个额外功能导致的,按住 ALT ,而且这项好像还没有开关。求助怎么破?难道只能关掉 Picviewer CE+ 脚本吗?

❌
❌