Normal view

There are new articles available, click to refresh the page.
Today — 8 January 2025Curiosity

[送] 简单的支出记录 app - 标签记账 3 个月免费试用

8 January 2025 at 12:34
lyuxiuchen: *非常简单的支出管理支出记录应用
*收入管理资产管理等复杂功能暂不支持

转成了订阅模式,现在兑换码生成数量提高了非常多
下面的链接可以兑换 2w 次 😀 不需要麻烦各位挨个试兑换码了

到期后如果喜欢可以再联系我

兑换链接:
https://apps.apple.com/redeem?ctx=offercodes&id=1624646468&code=LABELLEDGER3MONTHFREECODE

都说现在 ai 写代码厉害,但是我聊了半天也没法让 ai 正确处理一个独立的小需求

8 January 2025 at 12:16
TWorldIsNButThis:

用 Java 的 PDFBox 提取出 电子 f 票(铁路电子客票)上的 f 票标题、购买方名称、f 票号码等信息

原因是 f 票 pdf 里有个盖章,这个盖章和 电子 f 票(铁路电子客票) 这几个字在视觉上是重叠在一起的,导致直接根据区域提取文本会提取出错乱的文字

但是我发现直接用浏览器打开 pdf ,选中的文字时候,可以正确选中 电子 f 票(铁路电子客票) 这几个字

我问 ai 这个盖章是什么,它一会说是 PDImage ,一会说是 PDFORM ,给出了两个提取代码跑下来都是错的

我直接问怎么处理盖章,它给我发了一段 python 调 opencv 的纯视觉方案。。

还有上次用 poi 处理 excel ,想让图片变成嵌入到单元格,我特意转成英文版 excel 找到 excel 图片嵌入到单元格操作的原文去问也没用,回答都是错的

缩写是因为提示:发布这个内容需要你已经注册满 2025 天

非常好用的 midjourney api , MJ 接口,明码标价,量大非常优惠

By: victer
8 January 2025 at 12:11
victer: 超级稳,长期运营,明码标价、无猫腻。用过的老板都说好。

我们支持全网主流 ai 模型,主流的基本都有吧,chatgpt 、claude 、gemini 、mj 、sd 、flux 、suno 、luma 、智普、百度等
网站支持 5 种模式(每一种都是单独用户分组):逆向、按次计费(混合)、Azure 、企业无审核 Azure 混 openai 官 key 、纯 Openai 官方。
各位老板可根据自己的业务需求选择不同的渠道。

注册即送免费额度,测试满意您在使用。
云智 Ai-API
直达连接: https://api.openxs.top

分享一个自己做的简单的时序数据库

By: abbychau
8 January 2025 at 12:04
abbychau:

理念是在 WAL 中直接抓取,用 index 记录偏移量。

所以写入很快,内存消费很低。

详细文档在这: https://gtsdb.abby.md/

仓库: https://github.com/abbychau/gtsdb

管理工具(求求不要轰炸): https://gtsdb-admin.vercel.app/

觉得不错的话,有空可以帮忙在 Producthunt 点个赞

https://www.producthunt.com/posts/gtsdb

不靠谱的雨云,限制 CPU 长时占用,限制长时大流量,但是判定逻辑完全黑盒

By: lnbiuc
8 January 2025 at 11:58
lnbiuc:

阿里的 vps 带宽不是够,打算再购买一个 frp 用,看到有很多人推荐雨云,大概了解了下,没见过这么优越的服务商

1 、CPU 长时占用限制我勉强能理解,毕竟时 VPS 2 、带宽独享、有速度上限、有流量限制,为啥还限制长时大流量? 3 、对于以上的判断都是黑盒的,用户侧完全无法知道具体判断标准,岂不是我说你有问题,你就是有问题 4 、购买时没有明确说明以上,自己问客服才知道 5 、无任何 SLA 保证

总结:花钱装孙子

写了一个代码行复制的 NeoVim 插件,用于快速与同事共享代码

By: windcode
8 January 2025 at 11:52
windcode:

最近写了一个实用的 Neovim 插件( copypath.nvim ),解决了开发者常见的痛点:如何快速与同事共享代码位置?

https://github.com/elliotxx/copypath.nvim

主要特点:

  • 在 Git 存储库中时,按 Y 复制带有行号的 GitHub/GitLab URL ,例如 https://github.com/user/repo/blob/main/file.lua#L42

  • 回退到 Git 存储库外部的相对路径 + 行号,例如 src/file.lua:42

  • 自动 SSH/HTTPS URL 转换,例如 git@host:org/repo => https://host/org/repo

使用 lazy.nvim 安装:

{ 'elliotxx/copypath.nvim' }

花了周末两天时间,做了个高度定制化的短视频生成器!可快速批量生成!

By: Lifemm
8 January 2025 at 11:50
Lifemm:

功能:主要是预先准备好视频素材、文稿和标题,执行脚本等待几分钟即可获得高度定制的短视频文件。

处理步骤

  • 从文稿生成语音
  • 从语音生成 srt 字幕
  • 根据语音长度剪辑相同长度的视频素材
  • 将视频素材裁剪成抖音短视频比例
  • 将视频素材加入 label (个人标签)
  • 整合语音、视频、字幕、标题成一体输出
  • END

解决痛点(我自己认为的)

  • 需要用第三方的工具(网页)生成各种不稳定的语音文件( tts )
  • 以及用难用的工具生成字幕,并且字幕不准确,需要手动调整
  • 剪映好用,但是每次统一的模板都是需要微调,重复性的工作浪费时间。
  • 需要用以上多个工具,以及需要人为微调,目前我将绝大多工具整合为一个并且用代码做了微调,符合了我的预期。

分享一个免费试用的 AI 头像摄影工具,独立开发了 3 个月欢迎给建议

By: zzx0403
8 January 2025 at 11:49
zzx0403:

AI 摄影工具 iHeadshot AI 开发分享

我一直想试试独立开发发展副业,加上发现市面上很多 AI 头像摄影产品不仅昂贵而且不太像。

所以就自己试着开发了一款 AI 摄影工具 iHeadshot AI 。和其它产品最大的区别是支持先用后付费,在效果上是基于 Flux AI 训练 lora 的,所以还是比较逼真的。

欢迎大家感兴趣的试试,感谢提点建议~

🔗 产品地址:iHeadshot AI

大家的 springboot 项目中,有用到哪些高大上的目录名字呢?

By: NoKey
8 January 2025 at 11:43
NoKey: 基于 springboot 的项目,大部分还是 mvc 结构,然后产生了常用的目录名字,例如
controller
service
dao
model
等等,但是,这些目录一看就没 bi 格,没法进行年度回报
于是,根据 ddd 理论,衍生出一套目录层级
interfaces
application
domain
infrastructure
persistence
等等,对于开发人员来说,部分写法有一定变化,例如 pojo 不再是单纯的 pojo ,里面会增加这个 pojo 的各种工具方法,但是,总体来说,还是脱离不了 mvc 这个结构
大家的项目里面,有没有其他高大上的目录层级分层方法呢?学习一下~

家用 NAS 的备份方案?

By: ZGeek
8 January 2025 at 11:30
ZGeek:

运用「 3-2-1 原则」的目的则是,一旦遭遇文件损坏,及时的将文件恢复过来。所谓「 3-2-1 原则」,是指在进行文件备份时: 3:存储 3 份完整文件,一份原件加上两份拷贝。 2:将文件起码保持在两种不同的介质上。 1:将一份拷贝保存在异地。

但是这样做,对家用而言会带来两个较大的问题:

  1. 成本高昂
  2. 存储空间利用率低

考虑到家用 NAS 数据的数据类型,正常来说都是照片比较多,即使搭建了较多的 self-hosted 的程序,每天产生的数据量也不大,而且相比企业,也比较能接受 1-3 天的数据丢失带来的问题。

所以家用 NAS 想保证数据一定程度上的稳健,是不是这样做最好?

  1. 两块存储,一块用来热时存储,一块用来做冷存储,每天同步增量同步一份数据到冷存储
  2. 冷存储的数据也进行一下分割
    1. 文档数据, 每天同步到云存储一份(坚果云、onedriver 、等随便,个人文档类的,一般 15GB 足够了)
    2. 照片、影视类数据,每周同步到百度云或 oss (对象存储)一份(加密),因为这些数据变动不大,都是手机上拍完照之后攒一批才批量同步到 NAS 上的,手机上也不会立马删除。

各位是如何保证家用 NAS 上的数据安全的? PS:家庭用户,不考虑被攻击和病毒勒索的问题。

寻求点职业规划,考编或做生意?

By: Poluk
8 January 2025 at 11:29
Poluk:

所在地是 18 线小城市的一个区,24 年 6 月毕业,11 月报了我省的事业单位实习政策,就是事业单位一年的实习机会,每月只有补贴 2050 ,我选了一个离家近的小学

专科学软件开发的,技术不算那么那么差,自己在大学也下了点功夫,但学历在这个市场上毫无竞争力,加上行业现在本来也不缺人,所以去年 6 月回家之后,没有打算回南京的想法

我来小学之前没啥太多想法,政策是 9 月就开始招聘了,我 11 月初才报名来学校的,导致没办法再给我安排具体的课去教,日常就在教导处帮帮忙,没工作任务的时候就看书。

我们副校长觉得我总是在看书,但又不是教资/考编制的书,然后就是想让我考,我来之前没打算考编之类的,而且现在教师编限制比较多,就我所在的学校去年也就招聘 2 个,而且我专科学校和专业也不是教育师范类,想考的话还得先读个 2.5 年的成人本科,周期太长了。我现在也就能考个教资证,因为专业限制,只能考之前专业的教资,即信息技术教资(这个教资证去考教师编限制更大,因为信息教师基本每年不怎么招人)。

另一个想法就是我之前是想打算今年 7 月底结束打算去我上大学周边的美食城,学几样小吃带回这边做生意(比如我们这边没有的火烧灌饼,味道好的冒菜),而且现在再带上自媒体的免费广告,可能生意的曝光度会比以往大一些,西北人对吃的程度还是挺重的,我本身也更想做一个自己的事情。

考试竞争太大了,但是说句实话这边虽然比较落后,但是我同办公室一个入职 2-3 年的教师,一个月平均下来纯到手工资就得有 7000 左右,而且她什么职称都还没有的情况下。

求友友给点选择建议或经验,教师编这条路只能说周期又长竞争又大,时间成本可以说非常高,不知道两年本科拿到后,教师招聘岗位也许更少?又或者专业限制?但是如果真正考上的话,目前来说还是很香的。

请教 Python 大佬 Django-Q 的使用问题

By: xuqiccr
8 January 2025 at 11:28
xuqiccr:

小弟在使用 Django-Q 的时候发现建了 100 个任务,但是 q_cluster 只会执行前几十个任务,后面的任务会在队列中一直到 timeout 结束,但是看进程 q_cluster 的进程又是一直存在,头秃,不知道有大佬可以指点一下吗?

我的 settings:

# djangoQ 配置
Q_CLUSTER = {
    'name': 'myDjangoQ',  # 启动服务名
    'workers': 2,  # 多少个 workers 的数量直接影响了任务处理的并发能力
    'label': 'myDjangoQ_label',
    'orm': 'default',  # 使用 Django ORM 作为后端
    # 'recycle': 4,  # 工作进程在处理完指定数量的任务后,将自动重启自身以释放内存资源
    'timeout': 10,  # 超时
    # 'recycle_frequency': 4,  # 重启频率
    'compress': False,  # 是否将任务包压缩后发送到代理
    'save_limit': 250,  # 保存成功任务结果
    'sync': False,  # 是否同步执行任务
    'queue_limit': 2,  # 集群中的任务数量
    'cpu_affinity': 1,  # 单个任务使用 cpu 核心
    "redis": {
        "host": config.get("redis", 'host'),
        "port": config.get("redis", 'port'),
        "db": 3,
        "password": config.get("redis", 'password'),
        "socket_timeout": 30,
        "charset": "utf-8",
        "decode_responses": True,
        "max_connections": 1000,
    }
}

触发函数和具体执行函数:

def test(request):
    from django_q.tasks import async_task, result
    info = {'code': 0, 'data': [], 'msg': ''}
    try:
        task_ids = []
        for i in range(700):
            task_id = async_task(my_function, i)  
            task_ids.append(task_id)
    except:
        info['msg'] = 'test error'
        logger.error(traceback.format_exc())
    return JsonResponse(info, safe=False)

def my_function(i):
    logger.info('i:{} 开始开始开始开始开始'.format(i))
    logger.info('i:{} 开始'.format(i))
    time.sleep(random.randint(3, 5))
    logger.info('i:{} 结束'.format(i))
    return i

实际输出:

11:15:31 [Q] INFO Process-1:1 processing [undress-hot-october-high]
2025-01-08 11:15:31.602 | INFO     | deploy_queue.views:my_function:1637 - i:20 开始开始开始开始开始
2025-01-08 11:15:31.602 | INFO     | deploy_queue.views:my_function:1643 - i:20 开始
2025-01-08 11:15:31.610 | INFO     | deploy_queue.views:my_function:1645 - i:19 结束
11:15:31 [Q] INFO Process-1:2 processing [network-pizza-sink-emma]
2025-01-08 11:15:31.611 | INFO     | deploy_queue.views:my_function:1637 - i:21 开始开始开始开始开始
2025-01-08 11:15:31.611 | INFO     | deploy_queue.views:my_function:1643 - i:21 开始
11:15:31 [Q] INFO Processed [tennessee-sierra-timing-michigan]
11:15:31 [Q] INFO Processed [arkansas-muppet-charlie-orange]
2025-01-08 11:15:35.615 | INFO     | deploy_queue.views:my_function:1645 - i:21 结束
2025-01-08 11:15:36.607 | INFO     | deploy_queue.views:my_function:1645 - i:20 结束
11:15:41 [Q] WARNING reincarnated worker Process-1:1 after timeout
11:15:41 [Q] INFO Process-1:5 ready for work at 30020
11:15:41 [Q] INFO Process-1:5 processing [zulu-october-green-berlin]
2025-01-08 11:15:41.873 | INFO     | deploy_queue.views:my_function:1637 - i:22 开始开始开始开始开始
11:15:42 [Q] WARNING reincarnated worker Process-1:2 after timeout

可以看到前面 21 个任务执行正常,但是第 22 个开始就全是 timeout 退出,完全没什么头绪,令人头大。

买了个 mac mini 来做 nas,可行吗?

8 January 2025 at 11:24
silencelixing: 买了个 Mac mini M4 ,目前用 docker 搭建了很多服务,但是存储容量不够了。
我的需求就是存照片+视频+尽量功耗低。
目前已经买了 2 块 4T 的 3.5 存 sata 盘,
是不是再买个能休眠的硬盘柜,就是最优解了?
(备注:因为不相信自己能正确做好容灾,所以只是存一些不是很重要的照片影片,不组 raid )

doris 的问题

By: wueryi
8 January 2025 at 11:23
wueryi:

现在的背景:

  1. 现有数据在 es 中 关键的字段是 nested 结构 一个结构体的数组 例如字段叫 subsidy_data 值是:[{"id":3,"commission":0},{"id":12,"commission":3}] 现在想同步到 doris 中 做一些聚合计算 例如查询 subsidy_data.id=3 的所有数据

  2. doris 目标表是 UNIQUE 类型 doris 版本是 3.0 阿里云的 selected 实例 同步类型是 stream load 批量 同步到 doris 的时候目前可以针对 subsidy_data 这个字段 变成 json 或者 ARRAY<STRUCT<>>

  3. 但是目前看 doris 的文档 貌似不能通过函数对“json 数组”或者“ARRAY<STRUCT<>> ” 进行类似 es 的查询

  4. subsidy_data 的字段 可能存在各种变化 例如从长度等于 2 变成等于 0 所以可能更新数据的时候需要删除之前同 ralation_id 的所有数据 再执行插入

  5. 无法直接 cdc 同步原始表 因为中间还做了一些其他的逻辑处理 subsidy_data 只是一个示例 实际上还有类似的字段好几个

我的尝试

  1. 使用 insert into 配合事务插入主表和 多个关联表数据 但是性能不够快 没有 stream load 快
  2. 尝试使用异步物化针对主表 物化出关联表 貌似不行
  3. 尝试过 2pc 2 阶段提交 保证 stream load 的一致性 貌似对开启 cow 的表不支持

我的问题是:

  1. 是不是必须要拆分出关联表才可以进行类似 es 的 nested 的 1 对多的查询
  2. 如果不拆分出关联表 有没有其他的方案能实现?我尝试异步物化视图解 json 或者数据貌似不行
  3. 如果拆分出关联表
    • 怎么保证主表和关联表的一致性
    • 主表和子表的 left join 可以建物化索引吗 我看着 starrocks 支持

其他

  1. 还有其他更好的方案吗 期望大佬们的解答

杭州招贤纳士

8 January 2025 at 11:21
WangGuoMin:

创业!!!我的号:TG92ZS1DUjctTGFiYQ==

本人介绍:

之前一直从事的和 AI 相关的行业,算是资深后端了,从 24 年 9 月就出来创业,和一个销售一起合伙,搞一款 TOB 的产品。在 11 月份已经上线,目前在运营和试跑客户的阶段。但是本人想自己做一款产品,也想搭上这波 AI 大潮,已经在规划中,但是资金一直是个大问题,所以我现在主要是接了外包项目,目前已经有一点资金积累了,准备 25 年搏一搏。想找几个有能力的人一起搞。

团队介绍:

9 月份创业的那个公司有一个后端,2 个运营,1 个销售。
目前我要找的人员,是我新成立的一个公司。人员就是我+之前那个后端,以及一些朋友兼职。

需要人员:

产品 1 人:有想法即可,非常爱产品调研
前端(重要紧急) 2 人:有能力,非常拥抱 AI ,目前写代码 50%以上使用的是 AI ,相信 AI 代码质量和效率远大于自己
后端 1 人:java ,有能力,非常拥抱 AI ,目前写代码 50%以上使用的是 AI ,相信 AI 代码质量和效率远大于自己

待遇要求:

上半年只能边接外包,边开发自己的产品。如果之前那个业务能赚钱也能支援这边。我只能说能够保证杭州的平均以上的工资,或者外包项目能多赚点钱,我们多分点。目前已经有一个在项目中,后面还有 2 期三期。另外还有个项目在谈。希望寻找能够拿一年时间来拼一拼的志同道合的人。

各位程序员的护眼技巧分享一下

By: ShioWSX
8 January 2025 at 11:19
ShioWSX:

1 、我目前是 海露玻璃酸钠 + 叶黄素

2 、时把显示器手动调节颜色设置,蓝色调到最低,使得整个页面都很黄

3 、使用的是 vscode + onedark 暗黑主题

4 、日常能用电脑大屏幕处理的就尽量用电脑,不使用手机

5 、手机也是调成暖色加护眼模式

6 、以前夏天的时候还会早上用温热毛巾敷眼睛

各位还有什么补充建议的吗?因为我小时候眼睛受伤,导致只有一个眼睛能用,所以比较重视这块

请教电视影音玩得好的 V 友,新居即将启用,如何把智能电视影音规划起来

8 January 2025 at 11:12
XinPingQiHe:

已有基于 pve 搭建的 nas 及虚拟机若干,如果使用各类开源技术把智能电视玩转起来呢? 期望达到目标: 1.可以免费看电视直播 2.可以把电视作为某台虚拟机的显示器,在无线键盘鼠标的控制下浏览相关内容 3.给下载任务,可以自动下载指定的影像 4.能支持不开视频,仅听音乐。(音乐的播放可以在手机控制或者遥控器控制均可) 5.支持定时器(如半小时后 播放提示音) 6.电视+摄像头,能否搭建某些场景的手势互动游戏给孩子们玩... 请有经验的提些建议

❌
❌