Normal view

There are new articles available, click to refresh the page.
Today — 17 May 2025Curiosity

广州移动企业专线被当作 PCDN 通报了

16 May 2025 at 21:47
MaverickPLS:

月初刚发过关于家宽封停的帖子,这回轮到我自己了,甚至不是家宽而是专线。

是的,企业专线,正经合同,合同里没有不允许跑跨省/限制上传。

刚收到客户经理消息,我这条线路被省公司上榜 PCDN 专线,省外流量过多,不整改就会通报升级。

目前没有直接给停机,但是如果再跑流量估计就会被停了。

我从来没跑过 PCDN ,而且近 6 个月连 BT/PT 也停了,只挂了一个企鹅物流数据统计的国内站(已备案),网站一个月流量大概 500GB 。

刚刚查了一下过去两个月的日志,我自己是没跑 PCDN ,但是有一段时间有服务被 PCDN 刷流量用来平衡下行,两个月跑走了 55TB 。

不知道该先骂谁好……

也骂骂自己,这么多异常流量也没发现。

有没有 iPhone 常年开着小火箭的 v 友来聊聊

By: Milicense
16 May 2025 at 16:11
Milicense: 软硬件信息:iphone 16 、shadowrocket 、模式:配置(规则)、规则:用的机场默认规则。

我到目前为止一直都是把小火箭开关放在负一屏,需要用的时候滑过去按一下按钮,使用完了再关闭。

我的手机平时使用强度不高,常用的软件:微信、小红书、b 站、safari 、chrome 、telegram 、很多手机银行和信用卡 app (这些软件基本在开着代理的时候都会提示开着代理无法使用)

我现在想常年开着(规则模式)。我分析了一下应该是没什么影响的,但是总感觉心里怪怪的,请常年开着代理的老哥们聊聊看法?

程序员的创业想法

By: yoni123
16 May 2025 at 14:46
yoni123:

程序员极客&梗图衣服

本人是程序员,最近闲暇时间在考虑后面的出路。因家里是做跟服装有关的。现有一款专门卖给程序员的 T 恤衣服,整体设计为纯色,只在左胸口处有简单的程序员梗图或者只有程序看的懂的图案。 单价在 50 左右,与其他衣服的差异点和特点。

  1. 胸口图案印在一块魔术贴布料上,可自由替换贴在胸口处。一件衣服配多个胸口图案贴。
  2. 修身,透气,例如:可遮挡程序员的小肚子。
  3. 增值定制服务,提供胸口图案定制服务,客户发送图案,可帮客户烫印胸口口袋图案。

各位大佬们会去消费吗?

TG 无法登录,能否补救?

17 May 2025 at 11:58
wangxiaoer:

先说下背景,苹果手机,大概几年前买了个外区账号(具体哪个区不记得了),装了 TG 以及火箭等应用,没有退出过,但是期间很少用,唯一加入的就是一个 Alist 群组。TG 绑定了国内手机号。PC 端也是很早装过客户端,但是用的很少。

今天想加入一个 emby 群组的时候提示密码是否还记得,手贱去试了试,结果不记得了,然后就提示要 7 天后重置。茶尝试 PC 端登录也不行。这个时候手机端还是登录状态,还能正常使用。结果在某个群组里面查看消息提示版本不支持,于是考虑更新。

切换到美区 ID 登录,点击更新的时候提示 APP 已经下架,搜索得知,可能是之前下载的那个区把 TG 下架了,当时没多想,直接把手机上的 TG 卸载了。然后重新下载,很顺利就装上了。

启动后直接进入输入手机号的界面,输入之前的手机号,然后又要求输入邮箱和邮箱验证码,通过后要输入手机短信验证码,但是始终收不到。

如果还想使用之前的账号,这种情况还有办法登录吗?

咱 web 端也能跑本地知识库,RAG(傲娇)-篇章 2-数据预处理与匹配结果优化

17 May 2025 at 11:56
doujiangjiyaozha:

众所周知,RAG 最基本的流程是:

数据处理 → 向量化 → 存储 → 匹配文本 → 结果优化 → 最终的匹配结果

其中,数据预处理与匹配结果优化尤为重要。

1. 数据预处理:文本分块( Chunking )

在处理一篇长篇幅的文章时,通常需要将整个文本切分为多个小块,每个小块分别向量化后再存储。

拆分块的重要性

如果分块方式不合理,可能会导致无法命中真正相关的内容。因此,合理的分块策略至关重要。

如何拆分?

看这里:

👉 Text Splitters Overview - LangChain

  • 文章类型数据:推荐使用 Text-structured
  • HTML 等结构化标签类型:推荐使用 Document-structured

2. 弥补 RAG 匹配缺陷:大小块 + 关键词索引

即使文本被拆成多个块,匹配结果依旧可能不准确。因为 RAG 本身存在局限性:若问题与任何文本块都不相关,匹配效果自然不佳。

优化方案:参考 Danswer 架构

简单来说,就是将文本拆分成不同大小的块再配上关键词索引

  • 大块文本:提高语义层面的相关性
  • 小块文本 + 关键词索引:提高细节命中率

小块可以提供更多细节,但也可能带来噪音信息。


3. 匹配结果优化

多维度匹配后可能得到大量候选文本,因此需要做进一步排序:

  1. 基于向量匹配与关键词匹配的分数加权排序
  2. 使用轻量级的 rerank 模型
  3. 最终形成一组合理的匹配文本

4. Web 端落地(纯浏览器端)

文本块处理

import { RecursiveCharacterTextSplitter } from "@langchain/textsplitters"

const getBaseTextRecursiveSplitter = () => {
    const bigSplitter = new RecursiveCharacterTextSplitter({
        chunkSize: SPLITTER_BIG_CHUNK_SIZE,
        chunkOverlap: SPLITTER_BIG_CHUNK_OVERLAP,
        separators: SPLITTER_SEPARATORS
    });

    const miniSplitter = new RecursiveCharacterTextSplitter({
        chunkSize: SPLITTER_MINI_CHUNK_SIZE,
        chunkOverlap: SPLITTER_MINI_CHUNK_OVERLAP,
        separators: SPLITTER_SEPARATORS
    });

    return {
        bigSplitter,
        miniSplitter
    }
}

推荐参数配置

// split chunk relate
export const SPLITTER_BIG_CHUNK_SIZE = 1000; // 大块字符数
export const SPLITTER_BIG_CHUNK_OVERLAP = 200; // 大块重叠字符数
export const SPLITTER_MINI_CHUNK_SIZE = 150; // 小块字符数
export const SPLITTER_MINI_CHUNK_OVERLAP = 30; // 小块重叠字符数
export const SPLITTER_SEPARATORS = ["\n\n", "\n", "。", ";", ",", " ", ""]


关键词索引

使用 lunr.js + jieba(处理中文更优)


匹配结果的优化

考虑到运行在客户端的性能问题没使用 rerank 模型,仅通过加权与归一化排序处理并优化了一点打分逻辑

参考代码如下:

let [lshRes, fullIndexResFromDB] = await Promise.all([
    searchLshIndex(),
    searchFullTextIndex(),
]) as [Search.LshItemRes[], lunr.Index.Result[]]

// 向量匹配排序
const sortedLshRes = lshRes.sort((a, b) => b.similarity - a.similarity)
                           .slice(0, config.SEARCH_RESULT_HEADER_SLICE_SIZE)

// 全文匹配排序
const sortedFullIndexResFromDB = fullIndexResFromDB.sort((a, b) => b.score - a.score)
                                                   .slice(0, config.SEARCH_RESULT_HEADER_SLICE_SIZE)

// 重新打分、归一化
await FullTextIndex.loadJieBa()
const fullIndexFromDBTextChunkRes = await store.getBatch({
    storeName: constant.TEXT_CHUNK_STORE_NAME,
    keys: sortedFullIndexResFromDB.map((item) => Number(item.ref))
})

FullTextIndex.add([{ field: 'text' }], fullIndexFromDBTextChunkRes.map(item => ({
    id: item.id,
    text: item.text
})))

let newFullIndexRes = FullTextIndex.search(question)
newFullIndexRes = newFullIndexRes.sort((a, b) => b.score - a.score)
const maxScore = newFullIndexRes[0]?.score || 1
const reRankFullIndexRes = newFullIndexRes.map(item => ({
    ...item,
    score: item.score / maxScore
}))

// 合并向量和关键词匹配结果
let mixIndexSearchedRes: { id: number, score: number }[] = []
const vectorWeight = config.SEARCHED_VECTOR_WEIGHT
const fullTextWeight = config.SEARCHED_FULL_TEXT_WEIGHT

sortedLshRes.forEach(lshItem => {
    const match = reRankFullIndexRes.find(item => Number(item.ref) === lshItem.id)
    if (match) {
        mixIndexSearchedRes.push({
            id: lshItem.id,
            score: lshItem.similarity * vectorWeight + match.score * fullTextWeight
        })
    } else {
        mixIndexSearchedRes.push({
            id: lshItem.id,
            score: lshItem.similarity
        })
    }
})

// 补充关键词匹配的尾部数据
const lshTailStartIndex = Math.floor(vectorWeight * sortedLshRes.length)
const lshTailMaxScore = sortedLshRes.slice(lshTailStartIndex)?.[0]?.similarity || 1

reRankFullIndexRes.forEach(item => {
    if (!mixIndexSearchedRes.find(i => i.id === Number(item.ref))) {
        mixIndexSearchedRes.push({
            id: Number(item.ref),
            score: item.score * lshTailMaxScore
        })
    }
})

mixIndexSearchedRes = mixIndexSearchedRes
    .sort((a, b) => b.score - a.score)
    .filter(item => item.score > config.SEARCH_SCORE_THRESHOLD)

啥,你觉得这一套不靠谱,看下面!!!

成果

代码已开源(有帮助的话来个 star 吧)

github.com/Yoan98/Ncurator

想看实际演示?这里

www.ncurator.com

有啥能证明这个玩意靠谱呢?这里

1.上了阮一峰的周刊 科技爱好者周刊(第 337 期):互联网创业几乎没了

2.上了 DeepSeek 的集成推荐 https://github.com/deepseek-ai/awesome-deepseek-integration

你觉得小米玄戒 O1 能成吗?为什么?

By: initcom
17 May 2025 at 11:35
initcom:

你觉得小米玄戒 O1 能成吗?为什么?

雷军突然宣布,小米自研的手机 SoC 芯片命名为“玄戒 O1”,并计划于 5 月下旬正式发布。这一消息令业界震惊,同时标志着小米在芯片研发领域的重要突破。

回顾小米的造芯历程,雷军表示:“小米十年造芯路,始于 2014 年 9 月。超长周期、超大投入和无限的勇气,终于迎来了这一时刻。”事实上,小米在自研芯片的道路上已经走过了不少波折。

image.png

HC550 报错 UDMA CRC error count =1

By: igfw
17 May 2025 at 10:46
igfw: 请 V 友们给小白,给鉴别一下:

新近入手了一块二手 HC550 16T 。昨天插到 unraid 里面报错 UDMA CRC error count =1 ,目前只有这一处报错。

发现这个问题后,我在 unraid 上面执行 SMART 简短自建,提示没问题。

后关机更换硬盘盘位( 2 号>>>3 号),该硬盘仍然报这个错误提示。原本 2 号盘位插入另一块 hc550 正常。

由此是否可排除,sata 线或硬盘背板故障,从而问题锁定到此块硬盘上呢?

现在正在 unraid 上面执行扩展自检,进度 50%。

后续如果这个报错类型不增加,扫描完也没坏道,是不是就可以放心使用了呀。

https://s2.loli.net/2025/05/17/CAHyzlds1jXOtZJ.png

做了一个新玩具,在线 ffmpeg

17 May 2025 at 10:33
xiaoming1992:

支持命令:
$ echo
$ cd
$ clear
$ cp: 支持 -r 递归复制
$ pwd
$ cat
$ mkdir: 支持 -r 递归创建
$ mv
$ touch
$ rm: 支持 -r 递归删除
$ ls
$ vi/vim/edit: 编辑文件
$ help

$ download: 文件下载
$ upload: 加载文件到终端当前目录
$ ffmpeg: gif / 视频 处理

命令行预览

ffmpeg 在线合成 gif.gif

体验地址 https://16px.cc/sh/ffmpeg

微软 Trusted Signing 代码签名真不错

By: louisxxx
17 May 2025 at 10:25
louisxxx:

注册到申请几小时就通过了也没打电话 过程中就发了一个邮件验证, 点击里面 URL 进去确认然后就验证通过了(美国公司); 创建证书然后就能直接用 jsign 签名了,可集成到 CI/CD 中, 不需要微软那些 SDK 工具; 实测可过 smartscreen

brew install azure-cli
az login
region=eus
account=Trusted-Signing-account
profile=cert-profile-name
app=Download/app-win-x64-1.0.0-test.exe

jsign \
  --storetype 'TRUSTEDSIGNING' \
  --keystore "${region}.codesigning.azure.net" \
  --alias "${account}/${profile}" \
  --storepass "$(az account get-access-token \
    --resource 'https://codesigning.azure.net' \
    --query 'accessToken' -o tsv)" \
  "$app"

然后就签好了

奇怪了 ,最近 mac 能正常网路连接上「Podcast 」和「news」,但

17 May 2025 at 10:15
morisakitaku:
  • App Store 「无法连接,无法载入页面。请再试一次。」
  • Apple Music 「目前无法更新「云端音乐资料库」。 发生未知的错误( 11556 )。
  • Apple TV 「无法取得内容 载入此内容时发生问题。如果问题持续发生,请检查网际网路连线。 无法互联网)」

嘗試過,

  • 退出 QX ,重啟電腦
  • 更换 Wi-Fi 、
  • 连接手机热点,
  • 更新最新 macOS 系统,

都还是无法正常连结 App Store 、TV 、Music…


請問有什麼解決辦法嗎?

MacBook pro m4pro 续航拉垮

By: MasterCai
17 May 2025 at 10:14
MasterCai:

换机到 m4pro ,能耗模式选自动,亮度自动,只开了一些 chrome 和 vscode 远程以及一些其他没啥负载的程序,70 的电只能用 4h ? 和之前用 M1 mbp 时候的体验差太多了。也已经用了一段时间,大致可以排除 spotlight 重建索引的原因?其他用 m4pro 的朋友们耗电是个什么情况呢?

PinkBackground:一个粉粉的网站

17 May 2025 at 10:11
feixiangba2017: 大老爷们做了个粉嫩嫩的网站,目标用户是想要在各种社交平台(小红书、ins )发图的小女生,欢迎体验: https://pinkbackground.app
功能和亮点:
1 ,上传图片一键换成粉色背景(pink background);
2 ,直接文字生成粉色高清壁纸(pink wallpaper);
3 ,未来将提供更多粉色元素(pink elements)的图片和视频,欢迎收藏并持续关注;
4 ,目前还需要登录使用,打算做成免登录即可免费使用,但还在接入 comfyUI ,敬请期待。
❌
❌