Reading view

There are new articles available, click to refresh the page.

今日遇到的 wsl bash 执行 find 命令的问题,没正面解决

hwdq0012:

之前在写的 linux 程序会调 bash + find 命令批量改文件的后辍名

find /path2myDir/predict/labels -name \"*.txt\" -exec sh -c 'mv \"$0\"  \"${0%.txt}.predict\"' {} \\;

改为 windows 版本后, bash -c "command" 换成了 wsl bash -c "command..."
其他的命令都执行很正常,但这条重命令的命令一直失败,于是加了-x 把 wsl 执行的命令打印出来

"+ find /path2myDir/predict/labels -name '*.txt' -exec sh -c 'mv \"/bin/bash\" \"/bin/bash.predict\"' '{}' ';'

不知道为什么$0变成/bin/bash\ , 我尝过把$0 改为 1 也没有用

折腾了很久,最后在 wsl 里安装了 rename , 用 rename 指改了

在生产环境服务器中使用 AI,你怎么看?

dsd2077:

今天跟一位 V 友讨论 AI ,我觉得很有意思。我们的运维老大是支持使用 AI 的,我说的使用不特指全自动 agent ,可以是 chat 模型来问答,或者 command 模式来辅助。这位 V 友完全持反对意见。老哥的原话是:“如果在生产服务器上操作,还需要现搜现查复制粘贴,只能说这个人还不太熟,他不应该有生产环境的权限。排除一种场景就是小众的命令参数,或者不同 OS 里参数名不太一样,这种只针对参数的搜索不是复制。”

按老哥的说法,我应该第一个被删除服务器权限。别的不说,很多 Linux 命令我都没记住。

帖子如下: https://www.v2ex.com/t/1150688?p=1#reply40

如何能找到靠谱的老板呢

robinlovemaggie:

之前跟一个老板,我觉得我对他已经仁至义尽了,天天 996 还自带测试机,改需求秒回消息,甚至主动降薪表忠心。

然而说好三个月发项目奖金,拖了 10 个月一分没给,产品上线崩了全甩锅给我,最后工资都差点赖账,跑路前还画饼说“下次融资一定补上”。

我还是觉得我能赚钱,毕竟十年全栈经验,但怎么能找到不白嫖不画饼不跑路的老板呢?

预防 AI 泄密, 数据先在本地脱敏的优雅方案 PromptMask

cxumol:

AI 网站泄密并非新事, 2025 年年初先后爆出过 DeepSeek 拖库事件OmniGPT 拖库事件, 前不久还有沉浸式翻译暴雷事件。 AI 聊天对话记录能藏的东西太多, 服务商要存也只拿明文存, 导致泄密风险很高。

考察过已有的数据脱敏方案, 大部分是用正则替换实现的, 比如 langfuse, 还有你到 github 上随便搜, 也基本上是正则替换。 正则的缺点是只能预设有限的规则, 例如手机号, 身份证号等, 但对于姓名, 住址, 密码等格式不确定的情况无能为力。

还能想到的一个方案是 NER (命名实体识别), 这是传统 NLP 的东西, 有算法也有模型。 这样子姓名, 住址就能覆盖到了。 有个好处是能对敏感信息进行分类, 把张三替换为 [PERSON], 把东胜神州傲来国花果山水帘洞替换为 [LOCATION]。 这样语义信息能保留, 但信息量不一定够。 比方说涉及到复杂人际关系时, 替换为 [PERSON_1], [PERSON_2], [PERSON_3] 很容易让 AI 感到迷惑, 毕竟只相差一个字符/词元, 相似度高; 所以更好的办法是, 替换为此人身份角色代称, 这能让 AI 无需耗费额外 token 推理也容易理解人物之间关系。

基于正则、 NER 的脱敏方案还有个限制是保密定义的模糊性。 对于人名地名而言, 网友的真名实姓和家庭住址通常是不便透露的, 但换成让 AI 分析新闻、 制订旅游规划, 这时人名地名如果也被 "脱敏", 就怪不了 AI 随便乱答了。

上述问题导致传统数据脱敏方案在 AI 对话场景中, 要么敏感信息覆盖不完整, 要么容易降低 AI 服务的质量。 如果换成让 LLM 脱敏, 就好解决了。 奇形怪状的明文密码 / API Key 能轻松识别, 人名可以替换为角色身份, 地名也可以根据情景判断是否保密。 又因为保密本身的需要, 来做这项工作的大模型最好是跑在本地/内网环境里的。

我没有过上锦衣玉食的生活, 想象不到持有大显卡的快乐, 只能在内存/显存/算力有限的情况下研发, 跑小模型。 所幸, 小模型进步很大, 精心设计过提示词工程/上下文工程后, 验证了就算 1B 左右的模型也可以用于脱敏。 设计提示词有两个关键点: 1. 偏重模式匹配 (few-shot / 多样本学习) 而非指令遵循 2. 使其输出尽可能短, 否则容易超时/爆显存/幻觉篡改。

为了让输出尽可能短, 我的想法是, 不能让本地模型直接输出打码后的文本, 而是输出一段 json 格式的映射表, 比如 {"Jensen Huang": "${CLIENT_1_NAME}"}。 这就让输出长度只取决于保密这部分的信息量, 而不取决于原文长度太长。 映射表还有个好处是, 不但可以脱敏, 还可以还原。 比如 GPT-5 从语义上理解了形似环境变量的占位符的含义, 因此在回答中也包含了相同占位符, 就可以把回复内容里的 ${CLIENT_1_NAME} 换回 Jensen Huang, 从而不降低用户体验。

流程设计示意图:
diagram.png

如图, 因为中间层隔离了需要保密的信息, 所以用户侧只会看到无码的文本, 而云端只能看到打码的文本。 因为云端 AI 看到的是语义丰富的占位符, 因此不会降低回答质量。

在工程实现层面, 优雅的方案, 同样需要舒服的用户体验。 有两种方式可以融入已有的 AI 工具/流程里:

  • 在 python 代码/脚本中, 可以无缝替换 OpenAI 官方 SDK, 只要改一行代码, 实现自动脱敏打码, 自动还原去码
# from openai import OpenAI 换成
from promptmask import OpenAIMasked as OpenAI
  • 客户端填写 OpenAI 格式 /chat/completions API 时, 填写本地网关的地址, 本地网关负责实现自动脱敏打码, 自动还原去码, 并反代上游 /chat/completions API
pip install "promptmask[web]"
promptmask-web

并且在配置文件中指定上游 (默认 OpenAI 地址) 即可

[web]
upstream_oai_api_base = "https://generativelanguage.googleapis.com/v1beta/openai"

运行用于打码脱敏本地模型, 需要搭配跑本地模型的服务器。 默认对接端口是 ollama 的 11434, 如果用其它端口不同的服务器, 比如 llama.cpp, vllm, 或者部署在内网地址, 甚至要用公网服务 (假设有非常放心的 AI 服务商), 都可以修改配置文件来指定。

开源在 GitHub 上, 源码地址是 https://github.com/cxumol/promptmask
对于 "小尺寸 LLM 也能干活" 有疑虑的朋友, 也可以看看我的跑分 https://github.com/cxumol/promptmask/blob/master/eval/benchmark.md 当然跑分对用户也是有益的, 假如需要定制在特定场景下脱敏的 prompt, 可以自己跑分来优化脱敏 prompt 并挑选模型。 对于很小的模型, 预设的通用 prompt 在特定场景下估计比不过定制化的 prompt.

另外写了篇英文博客, 更加详细地讲解来龙去脉 https://xirtam.cxumol.com/promptmask-how-not-give-ai-secrets/

做这东西估计反正不会有任何商业价值。 我经济状况长期处于比较微妙的境地, 而这周起我的主要救济粮来源也断供了。 所以还特地去开了个 GitHub Sponsor, 希望多少有点收入吧。

世间安得双全法, 爽用 AI 不泄密?
小模型脱敏, 大模型答。

"神机假面"者, 藏己以利人, 隐真以成事。
善操蛇者, 应有"代李之术"。 旧符驭新马, 执其要而应无穷。
普罗大众, 应有"私设之关"。 坐享其成, 而不劳其神。
故秘事自隐,而神智畅游

[代发招前端 20~30k] 出海存储业务,地点大冲,双休,前端框架均可;

duruoduruo1258:

代友发招聘信息,感兴趣联系推荐 W:eGlhb2JhaXNodTUyMQ==( base64 )

重要信息如标题,JD 如下: 纳斯达克上市公司全资子项目,资源支持充足,业务稳定。

Web 前端开发工程师 岗位职责: 1 、负责产品的 Web 前端构建、维护、优化等研发工作; 2 、按需推动和实施前瞻技术的预研、规划,技术驱动产品创新。任职要求: 1 、本科及以上学历,1 年以上前端开发工作经验; 2 、有诸如 HTML5/CSS3/ES6/Node 等大前端技术栈研发经验,熟练掌握 Vue 、React 中至少一种前端框架熟悉浏览器原理,有互联网 C 端产品的前端研发和性能优化经验; 4 、熟悉 Python 研发技术者优先; 有海外互联网产品研发经验者优先;5 热爱互联网技术,具有极客精神,热衷于追求技术创新和创造极致体验;6 、 7 、具有优秀的跨团队合作能力,优秀的学习能力和自驱力,优秀的分析问题和解决问题的能力

交通肇事赔偿,双方赔偿金额谈不拢怎么办

M5tuA: 坐标苏北地区,朋友父亲在乡镇开汽车起重机,下班路上拐弯碰倒了一骑车大爷( 69 岁),送去医院后第二天告知死亡。
现在属于交通肇事罪,汽车起重机只买了交强险,朋友家全责,双方都咨询过律师。

与去世老人家属协商,目前进展:对方家属出具谅解书 10w ,丧葬费另算,死亡赔偿 70-80w 不等,朋友家算了下,减去交强险的赔偿,差不多也要 70-80w 。

朋友家里凑不出这么多,希望死亡赔偿的费用可以酌情少一点。对方拒绝沟通并且几次沟通下来还想再多要点。(相邻村落的,朋友家里找人去村落打听了下,一家属于无赖的那种,名声差到极致)
现在事情还没处理完,朋友看到他家坐地起价就有点心里犯嘀咕。如果对方觉得赔偿不到位,他父亲还得去坐大牢。要想满足对方要的高价,可能要把前两年刚买的房子给卖了,一波直接回到解放前,我朋友一家五口人最近因为这事很焦虑。

作为朋友我觉得他父亲当初抱有侥幸心理没买第三方险在这件事情上属实背大锅(只在附近几个村落做工,寻思就算上国道也就 1 公里左右下路进村),但是现在讲这也属于马后炮了。他家也比较典型,父母辛苦半辈子买了房,小生活刚有起色就碰到这事。

请问各位大哥们有什么建议吗?

[海外运营] 有两个海外运营的坑位

jakobzheng:

职位:海外商业化运营( C 端用户)

职责: 1 、制定并执行用户付费转化策略,提升核心产品的 ARPU 和 LTV ; 2 、基于用户画像和行为数据,制定用户分层运营策略,针对不同用户群体设计差异化运营方案; 3 、与市场、销售、产品等部门紧密合作,整合资源,打造高效的用户增长和变现闭环。 要求: 1 、211 、985 、QS200 本科及以上学历,工科专业; 2 、AI+行业经验,或有创作者资源、B 端资源; 3 、3-5 年海外用户运营经验,英文好。


职位:海外用户增长运营( C 端)

职责: 1 、对国际用户在线增长的收入、付费用户数、及粘性指标负责。 2 、通过国际用增在线增长不同在线渠道的运营策略制定和落地,以高 roi 的合作模式和强判断力,完成在线用增的商业化指标。 3 、具备技术产品商业发展的洞察视野和市场推动能力,领导并管理跨部门及跨生态的合作,共同推进与内外部伙伴的业务策略成功。 要求: 1 、211 、985 、QS200 本科及以上学历,工科专业; 2 、8 年以上用增运营经验,3 年以上海外用增经验,3 年以上团队管理经验,英文好。

微信: 18818268176 加好友请注明 v2ex

求推荐性能好一点的 4-6 盘位 NAS

somebodya:

想问一下广大的 V 友,现在性能比较好的 4-6 盘位的 NAS 有木有比较好的推荐, 最好声音小一点, 放在客厅。

想装 EXSI ,虚一台黑群晖,虚一台 Windows, 虚一台 Linux 开发机。硬解码需求约等于 0;

目前看了铭凡 N5, 高配叠加国补大概 5000 块; HPE 的 GEN10 V2,海淘回来大概 4700;

有没有在 Windows 下运行的类“Docker”容器化方案?

wunonglin:

目的是想在容器中跑百度云、QQ 音乐等等软件

我知道 Windows 有沙盒,但那个本质是个虚拟机,而且不能像 docker 一样有很好的存储方案,启动速度也不行,他是完全初始化的,然后关了数据就没了,因为本质是个纯沙盒。但例如 docker 停止后是不会删除容器的,数据还是在的。

最终希望的是把 90%的三方应用跑在容器中,这样电脑就舒服了,软件也不能随便拉屎了

这种情况该跑吗?

rustnj:

在一家小公司工作,目前情况是:

公司没有产品,也没有前端;

售前、开发、测试、运维等工作基本都由我一个人负责;

我已经有三年多的经验,但工资一直不高,也没有涨过;

提过几次希望招人分担工作,但老板始终不愿意。

现在我有些困惑,这种情况是不是该考虑换工作了?

我走了公司基本就黄了,如果走的话怎么跟老板提?

关于电脑配置

wcy0806:

各位 v 友,我弟弟学的是机电专业 现在想买一台电脑(带主机的),主要用的软件是 fusion 360 + inventor 想要配置略微高一些的,可否有 v 友给个配置清单 一经采用,奶茶奉上

闲谈:在家庭暴力行为中是否有很多后果轻微的暴力行为未被正确识别

Pangolin2004: 在人们的性别刻板印象和男女体格力量悬殊的前提下,由女性实施的后果轻微的暴力行为是否存在被低估和未能正确识别。

例如:
“我只是轻轻拍他一下,又不是真的打”
“我这么做只是想逗逗你”
“别人家都是这样”

想讨论这个问题并不是要挑起男女之间的矛盾,而是想正视这个问题。轻微不代表没有伤害。这些轻微的暴力行为或许是物理上的暴力行为(殴打)的导火索。

这个话题也困扰着我,想听听各位的意见,欢迎各位各抒己见,谢谢。

(题外:请警惕“弱小者”的“施暴”行为。在三角洲被哈基蜂背刺有感)
❌