Normal view

There are new articles available, click to refresh the page.
Today — 4 January 2025Curiosity

有什么好办法限制 Python 的内存分配吗?

4 January 2025 at 01:55
HawkinsSherpherd:

这是一段会吃掉几乎所有可用内存的代码:

def Decompress_Gzip_With_Progress_Bar(gzip_path, output_path):
    with gzip.open(gzip_path, 'rb') as f_in:
        with open(output_path, 'wb') as f_out:
            file_size = Get_Uncompressed_Size(gzip_path)
            chunk_size = 1024 * 1024
            with tqdm(total=file_size, unit='B', unit_scale=True, desc="Decompressing " + gzip_path) as pbar:
                for block in iter(lambda: f_in.read(chunk_size), b''):
                    f_out.write(block)
                    pbar.update(len(block))

它被用于解压一个解压后大概 4G 大小的文件。

直接在我的 16G 内存的开发虚拟机上运行,它会吃掉所有的内存。

但是,如果我把它放到一个分配 1G 内存的容器里,它不仅能运行,甚至还能运行得更快。

我试过用 resource 限制内存分配,但是它还是会吃满所有内存。

有没有什么能直接写到 Python 代码里的限制内存分配的方法呢?

如何搭建 PB 级影音存储服务器?

By: Raynard
4 January 2025 at 00:43
Raynard:

纯家用,不需要外网访问,

提出这个问题的原因是我有豚鼠的习惯,各种影视作品都想收集全,缺了少了会很难受。

目前用的是黑裙,100tb 已经存满了,为了下稀缺资源,删了好多普通资源,实在是心痛,所以生此想法。

期望的要求:维护简单,使用方便,可靠性高。

优先级排序(重要在前):价格、易用、可靠、耗电、噪音。

希望老哥们分享一下经验,感谢!能有详细设备型号参考最好了!

对方车实线变道导致的交通事故,无法出具事故认定责任书,大伙帮看看这个怎么维权。

4 January 2025 at 00:33
huandaeren: 1. 高架上,我在中间车道,对方车在右边车道。
2. 对方跨实线变道到我的车道,我急刹,最终没有发生严重的碰撞,仅我的车有轻微的刮擦,对方车辆仅车衣有一点点破损,基本没有痕迹。
3. 因为我在他的左后,所以我只有车头往前的摄像头能够拍到实线变道和疑似碰擦的情形。对方拒绝提供其车辆左边朝后的涉嫌头,交警反馈无法强行要求其提供视频,交通监控连车牌都无法识别。
4. 当前情况下,对方车主不承认有和我的车发生碰擦。交警反馈无法证明事故确有发生,无法出具事故认定责任书。

大伙帮看看,这个情况怎么维护自身合法权益。

请教下有什么比较通用的 3D 模型缩略图生成方案

By: nanajj
3 January 2025 at 23:33
nanajj: 目前我看有 3 种方案:

1. 利用 python + bpy + blander 生成,但不知道会不会资源占用太高。也不知道对于 linux server / serverless 支持如何。
2. 利用 Nodejs + Three.js / Babylon.js 这种前端方案渲染
3. 利用 一些库,比如 C++的,但可能要我再封装一下或 FFI 调用。

请教还有那些更成熟好用的方案吗? 或者该选哪个? 我首先考虑的肯定是能用, 所以目前倾向 1 。

[gpt]有什么手段可以突破单次对话 200k token 的限制吗

3 January 2025 at 23:32
Winner4good: 有什么手段可以突破单次对话 200k token 的限制吗;公司接的 api 是 claude sonnet 3.5
使用场景:经营数据分析,csv 格式,80%的场景都能满足;但是部分极端情况,数据会有几万行,然后有十几列,就超了 token 极限;
尝试过拆分 part1 、2 ,但是还是无法突破,直接报错了系统
或者换个思路,有无可以节省 token 、但是同样可以完成数据分析需求(要读完整个 csv )的手段

2024, 我借 AI 之力, 打造了上线首月用户破万的产品

3 January 2025 at 23:19
ChristopherWu:

全职创业已过了很长时间, 终于在 2024 年, 我们造出了值得骄傲的产品 --- hika, 一个月不到已经过万用户, 收获无数细腻的好评, 详情可看: 我 All In AI 创业一年后, 成绩如何?

img

hika 是什么?

HIKA 是一款免费的知识获取引擎,为你探索世界提供全新的方式与思路,你提出问题,HIKA 会实时搜索网络,深度思考并给出答案 HIKA 有什么:

  • 实时搜索:一个有着全网实时信息+自带知识库的答案引擎,并提供关键参考来源
  • 图文并茂:不仅有文字,HIKA 还提供多种图表分析,并直观展现重点概念间的关系
    • 快速解读全局知识点,一图胜千言
  • 深入研究:可对段落进行深入解读,并提供对其包含的关键点追问
    • 更贴合你的搜索习惯,哪里不会点哪里 ai 搜索

AI 驱动的 Hika

创业以来, 除了值得信赖, 非常靠谱的团队外(这个以后有机会再详细描述), 2024 年 最让我震撼的就是 AI.

Hika 采用了 AI 与人工协作的方式开发, 减轻了大部分枯燥的代码劳动, 但数据结构, 架构, debug, 压测等等还是要我们上; 运营适配各个国家不同语言的帖子都是 AI 写的, 很多细节是我跟 AI 商讨确认对齐的

AI 让 hika 整个团队的效率提升了不止一倍, 用一个比喻就是, AI 就是你自身的杠杆, 你水平越高, 这个杠杆越能提升你的效率

img

当然 Hika 也完成了自举, 我们平常使用 Hika 来提升开发 Hika 的效率. 这种深度融合 AI 的开发模式不仅大大提高了我们的工作效率,也让 HIKA 成为了一个真正由 AI 驱动的产品。

热心的人们

最让我感慨的是沿途帮助过我们的热心人.

hika 上线后, 由于团队里没有丰富运营经验的小伙伴, 我先顶上了; 那要做运营, 都是小账号, 没有万粉怎么做呢? 我脸皮厚, 也对 hika 的品质有信心, 除了平常发帖子宣传外, 就是逐个找一些活跃的小 v 大 v, 邀请他们试用 hika, 可以的话宣传一下

当然没有回复或者后续冷拒绝的人不少, 但亲自试用, 并热情地无偿转发 hika 的同样很多, 因此 hika 收获了不少用户

img

另外就是到 product hunt 上发布 hika 了, 由于其潜规则颇多, 我们已经是放到最后, 学习了挺多才发布了, 期间也踩了不少坑; 值得高兴的是, 不少同是运营都人主动加上我, 询问情况, 给我介绍起来上面的一些坑. 比如没有被 featured, 拿票拿到第一也没用; 一般在上面性价比最高的是拿到周榜, 但一般需要"买票" 等等. 虽然 hika 最后没有被 featured, 但学到这么多东西已经足够. 何况最后还是有外媒开始报道 hika, 我们收获了更多海外用户

img

还有创业的一些小伙伴, 主动热情地介绍了跟 VC 聊天时怎么聊, 什么 VC 合适我们团队, BP 怎么写, 融资怎么考虑; 还有我的朋友 hongqian, 分享了对商业模式有启发的书籍, 一直启发我从这方面来思考, 验证关键猜想(奈何这个转向实在太难..)

以及看到下面出海的这篇文章写得不错, 便加上了作者微信, 请教了一番, 深刻学习到运营真是很困难的事情

img

万字长文:“为什么我的产品在泰国次留 40%,但在美国只有 25%?”(完全版)

欢迎大家 2025 年继续使用 hika

Hika 帮助你解决了哪些问题?又有哪些需求还未满足?

我们非常重视每一位用户的反馈,并会认真考虑你的建议,期待你的分享!🤗

hika 可以通过谷歌搜索 hika ai 或者输入网址 hika.fyi 使用, 也可以点击原文使用

Debian, 中文文件名乱码,怎么整

3 January 2025 at 22:50
kevinyuandlp:

从 Youtube 下载视频:

debian@iZj6cctjpq1994jyxsr2kaZ:~/ytb$ yt-dlp 'https://www.youtube.com/watch?v=nWmuy5Ne4rU'
[youtube] Extracting URL: https://www.youtube.com/watch?v=nWmuy5Ne4rU
[youtube] nWmuy5Ne4rU: Downloading webpage
[youtube] nWmuy5Ne4rU: Downloading ios player API JSON
[youtube] nWmuy5Ne4rU: Downloading mweb player API JSON
[youtube] nWmuy5Ne4rU: Downloading m3u8 information
[info] nWmuy5Ne4rU: Downloading 1 format(s): 135+251
[download] Destination: 02 立方和公式及立方差公式 先修課 高中數學 [nWmuy5Ne4rU].f135.mp4
[download] 100% of 6.33MiB in 00:00:00 at 7.00MiB/s
[download] Destination: 02 立方和公式及立方差公式 先修課 高中數學 [nWmuy5Ne4rU].f251.webm
[download] 100% of 2.53MiB in 00:00:00 at 3.47MiB/s
[Merger] Merging formats into "02 立方和公式及立方差公式 先修課 高中數學 [nWmuy5Ne4rU].mkv"
debian@iZj6cctjpq1994jyxsr2kaZ:~/ytb$ ls
'02 '$'\347\253\213\346\226\271\345\222\214\345\205\254\345\274\217\345\217\212\347\253\213\346\226\271\345\267\256\345\205\254\345\274\217'' '$'\345\205\210\344\277\256\350\252\262'' '$'\351\253\230\344\270\255\346\225\270\345\255\270'' [nWmuy5Ne4rU].mkv'
1.txt

下载完的文件名乱码

测试建一个文件,在里面输入中文,是可以正常显示
debian@iZj6cctjpq1994jyxsr2kaZ:~$ cat 1.txt
测试

locale 的相关信息如下:

locale: Cannot set LC_CTYPE to default locale: No such file or directory
locale: Cannot set LC_ALL to default locale: No such file or directory
LANG=C.UTF-8
LANGUAGE=
LC_CTYPE=UTF-8
LC_NUMERIC="C.UTF-8"
LC_TIME="C.UTF-8"
LC_COLLATE="C.UTF-8"
LC_MONETARY="C.UTF-8"
LC_MESSAGES="C.UTF-8"
LC_PAPER="C.UTF-8"
LC_NAME="C.UTF-8"
LC_ADDRESS="C.UTF-8"
LC_TELEPHONE="C.UTF-8"
LC_MEASUREMENT="C.UTF-8"
LC_IDENTIFICATION="C.UTF-8"
LC_ALL=

Windows 上音频,鼠标遇到问题后,有没有像 macOS 一样有重启对应服务的办法?

By: x4storm
3 January 2025 at 22:40
x4storm: 之前 Windows 11 上音频播放出问题,出现滞后,卡顿,找了一圈,最终是重启解决。
现在在运行一个 ollama 推理的时候鼠标突然动不了,在网上找了一圈也没看到靠谱的,在不重启的情况下解决的办法。

之前在 Mac 上遇到音频相关的问题,都是 kill 掉某个服务,重启该服务就解决了,windows 上非得要重启系统。
感觉都不想在 windows 上进行开发和工作了。

有大佬解释一下 deepseek 和 ChatGPT 的关系吗?

By: fancy2020
3 January 2025 at 22:20
fancy2020:

最近看到挺多 deepseek 的新闻,好奇试了一下。
问了几个问题(英文)同时丢给 ChatGPT 和 deepseek ,发现 deepseek 的结果和 ChatGPT 的极其相似。
内容结构基本上是一摸一样的,就是替换了一些单词。

在网上也看到有人问 deepseek 是什么 model ,它回答是 ChatGPT 的。

对 AI 大模型的技术没什么了解,所以好奇问一下为什么会这样?

广州一站点开出超 5 亿大奖,福彩中心:中奖者已兑奖

By: dcy7287
3 January 2025 at 22:19
dcy7287: 1 月 3 日,广州市福利彩票发行中心公告,1 月 2 日,中国福利彩票双色球游戏第 2025001 期开奖,当期广州市中出一等奖的彩票共 3 张,其中 2 张均为 100 元 50 倍的单式票,1 张为 32 元的蓝球全包复式票,3 张中奖彩票共计中得 101 注一等奖和 15 注二等奖,奖金合计人民币 531000605 元。彩票中奖者已在我中心完成兑奖,缴纳个人所得税人民币 106200121 元。

iTerm2 用户请升级

By: 19x0
3 January 2025 at 22:14
19x0: 准备换回原生终端了~

https://iterm2.com/downloads/stable/iTerm2-3_5_11.changelog

You may be affected if you used the SSH
integration feature in any of the following
versions:

* 3.5.6
* 3.5.7
* 3.5.8
* 3.5.9
* 3.5.10
* Any beta versions of 3.5.6 and later.

What is the issue?
------------------
A bug in the SSH integration feature caused input
and output to be logged to a file on the remote
host. This file, /tmp/framer.txt, may be readable
by other users on the remote host.

Apple Watch Ultra 相比无印版本有多耐用?

3 January 2025 at 21:49
yousaisama: 如题,自从 Apple Watch Series 7 之后就没再换过智能手表,但是经过长期的裸奔使用,它已经布满划痕,令人不忍直视了。
趁着新年,我想换一块新的手表,目前看中了 Apple Watch Ultra 2024 ,既然苹果宣称其坚固耐用,我想问一下用过它及上代产品的 v 友们,在没有大量极限使用场景的情况下,Apple Watch Ultra 是否能在三到五年之后依然保持比较良好的状态呢?

有没人知道 appletv 为什么重置后只有默认的几个 app?

By: kijnife4
3 January 2025 at 21:47
kijnife4: 这是咸鱼买来的二手六代 appletv ,原来有 tv+,音乐之类的自带 app ,但是重置后这些应该自带 app 全没了,登录上去就只有设置 搜索 应用商店 facetime 这四个 app ,而且全程登录的是美区 id ,也试过切换账号都没用,甚至软路由设置全局代理都不行,后续也重置过很多次了,会不会是什么特殊渠道设备?

才知道,移动的高频骚扰电话拦截业务,会消耗移动流量。

3 January 2025 at 20:54
JerryLee13: 移动的高频骚扰电话拦截业务,会消耗移动流量,这到底是个怎么样的逻辑呢?

我是怎么发现这个情况的呢?

前提:主卡是联通卡,副卡是移动卡,蜂窝数据是主卡,事发时一直都是连接 WIFI 。移动卡是从化 0 月租的卡,套餐内是没有流量和通话时长的(套餐外流量按照 0.29 元/MB 收费,不足 30 元按实收取,每达 30 元即自动赠送 921MB 国内通用流量)

经过:今天下午收到移动短信说,成功拦截了一通境外电话。隔一分钟后,收到流量超额扣费的信息。疑惑?遂电话客服咨询,确认是高频骚扰电话拦截,使用了流量。再问也没问出个所以然来。

结果:要求退费,取消高频骚扰电话拦截业务,关闭上网服务。
Yesterday — 3 January 2025Curiosity

有静态分析工具可以分析出因为拆箱导致的空指针 NPE 吗?

By: inza9hi
3 January 2025 at 20:07
inza9hi:

我一直以为静态分析已经很强大了, 尝试了下 IDEA 自带的工具和 PMD 竟然都分析不出来。

PS: A 是 Pb 生成的,B 是手写的,所以导致有用 int ,有用 integer

@Data
    static class A{
        private int a;
    }
    @Data
    static class B  {
        private Integer b;
    }

    public static void main(String[] args) {
        A a = new A();
        B b = new B();
       a.setA(b.getB());
    }
❌
❌