Normal view

There are new articles available, click to refresh the page.
Today — 9 May 2025Curiosity

比尔·盖茨宣布将在未来 20 年内捐出几乎所有财富

By: Fdyo
8 May 2025 at 23:35
Fdyo:

比尔·盖茨( Bill Gates )在一封公开信中宣布他将在未来 20 年内通过盖茨基金会捐出几乎所有财富,届时预计捐赠总金额将超过 2000 亿美元,盖茨基金会也将于 2045 年 12 月 31 日关闭。

原文:比尔·盖茨将在 20 年内捐出几乎全部个人财产,并于 2045 年关闭盖茨基金会

纯稳定、便利且长期家庭数据存储,不知道什么方案才合适了。

By: gigishy
8 May 2025 at 23:27
gigishy:

家庭各成员每天都产生不少照片、视频、今天记录、文件等,这些核心个人数据是必须保存几十年上百年的,同时考虑成员计算机应用水平,最核心的家庭照片、视频需要随时备份到存储设备上。所以、稳定、安全(可以最初考虑只在家庭局域网不上 wan )、方便(存取恢复等),长期(保存)就成了必须的关键字了。其次才是成本等因素。 考虑过也尝试过光盘、磁带、机械硬盘(包括 nas )(都有过丢失数据的惨痛经历),好像没有合适的十年(至少八年)为基本周期的方案。不知道大家有些什么建议?谢谢。

为什么 OpenAI 要收购 Windsurf?

By: largep
8 May 2025 at 23:19
largep:

Hacker News 上的讨论: https://news.ycombinator.com/item?id=43743993

OpenAI 的 Search+Reason 回复: https://chatgpt.com/share/681cc92e-a1cc-8003-9d1e-76c46dd9b94a

我的看法:

  1. Anthropic 走客户端开放互联的思路,搞的 Computer Use 、MCP, 尤其是强大的编程能力,证明选的路子是对的,自身推出的 Claude Code 体验也不错;编程能力牛叉,就可以串联很多场景,组成各种应用,可以想象通过自动生成的程序控制<计算机/机器人>,比如 PAL 的概念( https://reasonwithpal.com/)。

  2. 相反 OpenAI 在这个竞争中落得了下乘,其推出的 Code Interpreter 、GPTs 、Assistants API 等尝试,都企图早早的把 LLM 计算和场景圈在自己的领地,反而效果很差。所以一般的评价是 GPT 模型只适合聊天😂

  3. 对于 AI 的未来,我判断未来的热点肯定是机器人,肯定是实时视觉的多模态动作模型 (BTW, 这个点上 Google 做的领先了一点点);但现在无论模型的发展还是算力目前都还跟不上,但这不妨碍在现有的技术基础上做些复杂 context 的大模型应用,而自动编程则是复杂度刚好、又有足够市场的一个领域,Product-market fit(PMF)刚刚好。

  4. 为了追赶 Anthropic ,对于 OpenAI 来说 Windsurf 就是个很好的标的。能获得已经较完整的产品和团队,能跑起来的数据飞轮。

分享下自己搞的一个 Markdown 文档批量工具 mdctl

By: samzong
8 May 2025 at 22:59
samzong: https://github.com/samzong/mdctl

主要是把一些 Markdown 经常遇到的功能进行了一些整合,目前托管自建的 Homebrew ,安装也算方便吧。

(觉得不错的可以点个 star, 貌似超过 30 个才能进入 homebrew-core ,不会推广还是挺难的)

```bash
brew tap samzong/tap
brew install samzong/tap/mdctl
```

全平台通用,最近增加了一个自动构建镜像,在 github workflow 等这些场景也可以直接使用,目前支持的功能有:

- downlaod ,自动索引 md 文件内的远端图片地址,下载并替换
- translate ,利用 llm 翻译 Markdown 到多语言,适配 OpenAI 协议
- upload ,检测 md 文件中的本地图片并上传到云端 (S3 协议、cloudflare r2)
- export ,适配静态网站构建工具 mkdocs 等,导出 Word 等格式
- llmstxt ,利用网站 sitemap.xml 自动转为大模型友好的 llms.txt
- 自动构建 images, 可在 Github Action 等 CI 场景直接使用。

关于要不要提前还房贷,想听听大家想法呢

By: Yutin
8 May 2025 at 22:36
Yutin: [关于房子]
• 副省会城市,普通地段,首套房,自住用途(自己长期住不了,准备让父母住)。
• 23 年 8 月买的,纯商业贷款 30 年,总贷 136 万,等额本息,月供 6154.26 。

[关于我]
• 未婚,长期出差,房子几乎住不到,准备让父母住进去,短期内( 3-5 年?)不会考虑卖掉,对涨跌也不敏感;
• 父母普通收入,没什么存款,但足够照顾好自己,不需要我额外支持。但是通过贷款借给家里亲戚大概 30-40 万,要不要的回来不好说(不展开,关系很近,可以理解);
• 月供完全没压力,到年中预计手里能有 20w 存款,暂时也没有其他需要花钱地方;
• 公积金还没用过,一是当时买房的时候没多少公积金,用了也没啥花头;二是现在打算这套房子长期给父母住,后面自己要结婚的时候考虑再买房的时候可以用公积金;

[要不要提前还房贷?想听听大家的想法]
• 我的初步想法是不提前还,主要考虑:
① 每月还款六千多压力不大,提前还个 10 万进去,大概算了算每个月也就少个 500 左右,但是手里得直接减少 10 万现金;
② 钱会越来越不值钱,以后的六千多更不值得一提;
③ 收入还可以,房贷可以抵一部分个人所得税;
• 不过翻了下 V2 ,好像大多数人还是倾向于降低负债。
结合我这个情况,大家觉得有没有必要提前还一部分?欢迎交流~

广州外企 - Principal Data Framework Engineer - 50-80k

8 May 2025 at 22:19
felixchen1314: 福利:每周 3 天 WFO ,2 天 WFH ,20 天年假
JD 如下:
Job Summary

The Principal Data Framework Engineer develops reusable frameworks and tools that enable teams to build pipelines and workflows efficiently. This role focuses on designing metadata-driven solutions for ETL, workflows, and data specifications, optimizing data integration processes, and ensuring seamless interaction with the platform’s core components. The Framework Engineer also implements robust data quality and integrity checks, enabling a scalable and flexible framework for data engineering tasks across the organization.
Strategy
• Framework Development: Design and implement flexible, metadata-driven frameworks for ETL, workflow orchestration, and data specifications to support efficient pipeline creation.
• Standardization: Establish best practices and reusable components for data ingestion, transformation, and processing to streamline efforts across teams.
• Metadata-Driven Design: Build frameworks leveraging metadata to define and automate ETL processes, workflows, and data specifications, ensuring flexibility and scalability.
• Data Quality Checks: Develop and integrate automated data quality checks into frameworks using tools like Great Expectations or similar solutions.
• Data Integrity Checks: Ensure frameworks include mechanisms to validate data integrity across pipelines, capturing schema changes, record counts, and column-level validations.
• Integration: Build seamless integrations with core platform components like Apache Iceberg, Spark, Kafka, Airflow, and Argo to enable consistent processing across batch and streaming workloads.
• Workflow Orchestration: Develop metadata-driven workflow orchestration frameworks to enable easy configuration and deployment of ETL processes.
• Reliability: Build frameworks with fail-safe mechanisms to handle errors and ensure reliability in pipeline execution.
• Compliance: Ensure frameworks adhere to governance policies and regulatory requirements
Key Responsibilities

Business
• Enablement: Empower data engineers and analysts with user-friendly, metadata-driven frameworks to accelerate development and ensure consistency.
• Stakeholder Alignment: Collaborate with domain and platform teams to ensure frameworks address key business and technical requirements.
People & Talent
• Collaboration: Work closely with platform and data engineers to ensure frameworks align with infrastructure capabilities and operational requirements.
• Skill Sharing: Provide technical documentation and training to engineers and analysts using the frameworks.
Governance
• Compliance & Regulatory Adherence: Ensure compliance with internal and external regulatory requirements, including data sovereignty, privacy, and resilience standards.
• Data Governance & Quality: Implement data governance policies implementation to maintain data quality, integrity, accuracy, and consistency across the platform. Implement monitoring tools to proactively address data quality issues.

Regulatory & Business Conduct
• Display exemplary conduct and live by the Group’s Values and Code of Conduct.
• Take personal responsibility for embedding the highest standards of ethics, including regulatory and business conduct, across Standard Chartered Bank. This includes understanding and ensuring compliance with, in letter and spirit, all applicable laws, regulations, guidelines and the Group Code of Conduct.
• Effectively and collaboratively identify, escalate, mitigate and resolve risk, conduct and compliance matters.
Skills and Experience

Key stakeholders
• Rest of Data & Analytics team
• WRB/CIB/GF Architecture teams
• Business and Functions Data & Analytics Team
Other Responsibilities
• Embrace and practise SCB’s brand promise of Here for Good and corporate values
• Perform other responsibilities assigned under Group, Country, Business or Functional policies and procedures
• Responsible for building a culture of good conduct
Qualifications

• Bachelor’s or Master’s degree in Computer Science, Data Engineering, or related field.
• Expertise in Python, Java, with a focus on building reusable frameworks.
• Experience with metadata-driven framework design for ETL, workflow orchestration, and data specifications.
• Proficiency in data quality and integrity tools like Great Expectations or similar solutions.
• Hands-on experience with Apache Spark, Kafka, and orchestration tools like Airflow or Argo.
• Familiarity with governance tools like Apache Ranger, OpenLineage, and DataHub.

Required skills
check
Framework Development
check
Database Development
check
Data Quality
check
Data Security
check
In-Fusion
check
Process Integration
check
System Reliability
check
Legal Compliance

有人收到过大中厂 offer 么,求一个邮件

By: 0x0x0x0
8 May 2025 at 21:50
0x0x0x0:

有偿,帮 HR 朋友求一份国内大中厂的真实 Offer 邮件(比如网易/百度/快手/小米/唯品会这种)。

1.可以是自己收到但没有接收的 offer ,可以隐藏或者修改个人信息

2.邮件内容包含薪资结构部分(可自行修改具体数字)

3.下载为 eml ,vscode 编辑一下,隐去个人信息就好咯

带样本截图微信联系。仅用于参考,不做商业用途。

weixin

最近遇到了 3 次非常难查的问题,很无助

By: zhoudaiyu
8 May 2025 at 21:25
zhoudaiyu: 本人是 sre ,负责 k8s 和一些如 kafka zk 的中间件的运维,最近遇到了 3 个问题好久都没查出来。第一次是 3 节点 zk 集群夜间突然 1 台 cpu 拉到 100%几分钟后 cpu 掉下来了,但节点不可用,然后 2 个小时后另外一台又这样了,也挂了,然后集群不可用了。第二次是 6 节点 kafka 突然有一台 cpu 很高,重启没用,停掉后部分业务又开始报错,提高 cpu 配置(容器),并迁移了受影响的一个业务后启动后突然就一切正常,cpu 使用率也没那么高了,其他业务也没事了。第三个是 docker info 、docker images 突然 hang 住,几个小时自己恢复了,然后又开始反复。这几次中间件除了 zk 那个日志被清理了看不到当时报错,其他都没有什么报错,无从查起,很无力,领导 又要结果。

接了个单,想问一下有没有法律风险?

By: psyer
8 May 2025 at 21:16
psyer: 在某个群接了个单,要完成的需求是:他们给我一点广告链接,让我用 Python 脚本模拟用户去点击,服务器在海外,提升 Google Ads 的点击率,大概就是这样,每天可能有 1000-2000 次点击。海外服务器等资源他那边提供,我只提供脚本。



简单来说就是模拟用户去点击广告链接,主要是海外跨境电商,海外环境。这种行为存在法律风险吗?违法吗?

双持 ios 和 android, app 同步怎么处理

By: leosj
8 May 2025 at 20:55
leosj:

比如抖音,taobao 这些可以同时登陆,qq ,微信不能同时登陆,网上有 pad 版本的,但是怕封号,有没有同步消息的,比如我 ios 登陆微信 A ,安卓登陆微信 B ,A 收到消息,就推送到微信 B ,B 收到消息就推送微信 A ,感觉这样做还没有 pad 版本那种好

做了个 llms.txt 生成器,据说对 SEO 有好处

By: HackerQED
8 May 2025 at 20:51
HackerQED: 道听途说这玩意对 SEO 大有好处,有个老哥靠这个从 chatbot 一个月拿了几千流量。

感觉这玩意会流行起来,也是自己手里小站太多,懒得一个个写,就做了个生成器: http://llmstxtgenerator.co

免登陆使用,限制了最多抓 5 个页面,怕网友把我拉爆。token 用得还挺多的。

用法:输入 sitemap ,后台抓网站内容,ai 生成 llms.txt ,大致就是一个专门写给 ai bot 的文件,包含了网站的用途和重要链接。

什么是 llms.txt: https://llmstxt.org
Yesterday — 8 May 2025Curiosity

做下面一个服务号和小程序 大概需要多少成本

By: koyeelin
8 May 2025 at 20:34
koyeelin:

第一阶段: 1 、骨灰寄存费(单项):在手机上操作骨灰寄存费的续费,线上开票(需要对接非税系统),线上查询缴费期限 2 、预约祭拜:清明期间可线上预约拜祭时间。 3 、说明、办事指引等。

第二阶段: 4 、业务预约:在手机上操作“线上报丧”,预约遗体接运时间,棺木的选购,火化炉的选择。 5 、资料:可上传办理丧事所需的相关资料,并在网上审核是否通过。 6 、线上业务办理后的缴费,线上开票(需要对接非税系统)

总体费用:包括服务号和小程序的每年认证费、腾讯云服务费、域名服务费

❌
❌