Normal view

There are new articles available, click to refresh the page.
Today — 9 May 2025Curiosity

感觉快活不下去了

By: GodVan
8 May 2025 at 03:17
GodVan:

父亲快 60 岁了做生意的,两年前口罩导致破产,我单亲独子前两年为了挽救父亲的生活拿出了大部分存款帮他。 我 30 岁的开发(php/python/vue)然后去年年底被裁员了,没想到行情能这么差劲,到今年 4 月份愣是没几个面试。 本身存款就不多了,兜里的票子在上海撑不了几个月了,现在焦虑的不行不行的,感觉没退路了。 准备去老家以及周边城市再找找试试,要是再没工作真是要喝西北风了。 好绝望,感觉为了活下去真的太累了,经常失眠,顺便求一份工作: 本人多端开发经验,从后端到前端,从 web 到接口。

有开发经验: ·CRM 、ERP 、OA 等业务系统开发经验 ·电子签中心化系统、人员信息管理、客服系统; ·数据开发平台(建模、编排等、数据 api 管理); ·AI 助手平台( AI 客服、知识库、问答机器人等); ·业财系统(财务报表等); ·出行服务;

技能: 熟悉 PHP(5.4~8.0),有 ThinkPHP 、Laravel 、Lumen 、Swoft 等框架使用经验 ·熟悉 Python ,有 FastApi 框架使用经验,有常用库 gunicorn 、pandas 、celery ,playwright 等使用经验 ·熟悉 Html5/css(less 、scss)/JS(jQuery 、Vue1/2/3)、等前端页面技术 ·了解完整的 Vue 解决方案,能够独立进行前端的各类开发工作。 ·有常见前端库 antd 、iview 、element 、bootstrap 等使用经验 ·熟悉 uniapp 的跨平台开发,有多端( web/android/ios )的 uniapp 开发、打包发布经验。 ·熟悉 MySQL 等关系型数据库的使用、优化 ·熟悉 NoSQL(MongoDB 、Redis),Clickhouse 、向量数据库 Milvus 的使用,有 Elasticsearch 的使用经验 ·熟悉缓存 Redis 的使用,消息队列 redis 、mq 、celery 的使用 ·熟悉 Linux 操作系统,熟悉 lnmp 架构,熟悉 docker 容器技术 ·了解 devops ,Jenkins ,git/svn 等相关版本管理和集成发布流程和工具的使用 ·有 aigc 、llm 的应用开发经验( embedding 、rag 、agent 等)及相关库 langchain 、hanlp 等使用经验

比尔·盖茨宣布将在未来 20 年内捐出几乎所有财富

By: Fdyo
8 May 2025 at 23:35
Fdyo:

比尔·盖茨( Bill Gates )在一封公开信中宣布他将在未来 20 年内通过盖茨基金会捐出几乎所有财富,届时预计捐赠总金额将超过 2000 亿美元,盖茨基金会也将于 2045 年 12 月 31 日关闭。

原文:比尔·盖茨将在 20 年内捐出几乎全部个人财产,并于 2045 年关闭盖茨基金会

纯稳定、便利且长期家庭数据存储,不知道什么方案才合适了。

By: gigishy
8 May 2025 at 23:27
gigishy:

家庭各成员每天都产生不少照片、视频、今天记录、文件等,这些核心个人数据是必须保存几十年上百年的,同时考虑成员计算机应用水平,最核心的家庭照片、视频需要随时备份到存储设备上。所以、稳定、安全(可以最初考虑只在家庭局域网不上 wan )、方便(存取恢复等),长期(保存)就成了必须的关键字了。其次才是成本等因素。 考虑过也尝试过光盘、磁带、机械硬盘(包括 nas )(都有过丢失数据的惨痛经历),好像没有合适的十年(至少八年)为基本周期的方案。不知道大家有些什么建议?谢谢。

为什么 OpenAI 要收购 Windsurf?

By: largep
8 May 2025 at 23:19
largep:

Hacker News 上的讨论: https://news.ycombinator.com/item?id=43743993

OpenAI 的 Search+Reason 回复: https://chatgpt.com/share/681cc92e-a1cc-8003-9d1e-76c46dd9b94a

我的看法:

  1. Anthropic 走客户端开放互联的思路,搞的 Computer Use 、MCP, 尤其是强大的编程能力,证明选的路子是对的,自身推出的 Claude Code 体验也不错;编程能力牛叉,就可以串联很多场景,组成各种应用,可以想象通过自动生成的程序控制<计算机/机器人>,比如 PAL 的概念( https://reasonwithpal.com/)。

  2. 相反 OpenAI 在这个竞争中落得了下乘,其推出的 Code Interpreter 、GPTs 、Assistants API 等尝试,都企图早早的把 LLM 计算和场景圈在自己的领地,反而效果很差。所以一般的评价是 GPT 模型只适合聊天😂

  3. 对于 AI 的未来,我判断未来的热点肯定是机器人,肯定是实时视觉的多模态动作模型 (BTW, 这个点上 Google 做的领先了一点点);但现在无论模型的发展还是算力目前都还跟不上,但这不妨碍在现有的技术基础上做些复杂 context 的大模型应用,而自动编程则是复杂度刚好、又有足够市场的一个领域,Product-market fit(PMF)刚刚好。

  4. 为了追赶 Anthropic ,对于 OpenAI 来说 Windsurf 就是个很好的标的。能获得已经较完整的产品和团队,能跑起来的数据飞轮。

分享下自己搞的一个 Markdown 文档批量工具 mdctl

By: samzong
8 May 2025 at 22:59
samzong: https://github.com/samzong/mdctl

主要是把一些 Markdown 经常遇到的功能进行了一些整合,目前托管自建的 Homebrew ,安装也算方便吧。

(觉得不错的可以点个 star, 貌似超过 30 个才能进入 homebrew-core ,不会推广还是挺难的)

```bash
brew tap samzong/tap
brew install samzong/tap/mdctl
```

全平台通用,最近增加了一个自动构建镜像,在 github workflow 等这些场景也可以直接使用,目前支持的功能有:

- downlaod ,自动索引 md 文件内的远端图片地址,下载并替换
- translate ,利用 llm 翻译 Markdown 到多语言,适配 OpenAI 协议
- upload ,检测 md 文件中的本地图片并上传到云端 (S3 协议、cloudflare r2)
- export ,适配静态网站构建工具 mkdocs 等,导出 Word 等格式
- llmstxt ,利用网站 sitemap.xml 自动转为大模型友好的 llms.txt
- 自动构建 images, 可在 Github Action 等 CI 场景直接使用。

关于要不要提前还房贷,想听听大家想法呢

By: Yutin
8 May 2025 at 22:36
Yutin: [关于房子]
• 副省会城市,普通地段,首套房,自住用途(自己长期住不了,准备让父母住)。
• 23 年 8 月买的,纯商业贷款 30 年,总贷 136 万,等额本息,月供 6154.26 。

[关于我]
• 未婚,长期出差,房子几乎住不到,准备让父母住进去,短期内( 3-5 年?)不会考虑卖掉,对涨跌也不敏感;
• 父母普通收入,没什么存款,但足够照顾好自己,不需要我额外支持。但是通过贷款借给家里亲戚大概 30-40 万,要不要的回来不好说(不展开,关系很近,可以理解);
• 月供完全没压力,到年中预计手里能有 20w 存款,暂时也没有其他需要花钱地方;
• 公积金还没用过,一是当时买房的时候没多少公积金,用了也没啥花头;二是现在打算这套房子长期给父母住,后面自己要结婚的时候考虑再买房的时候可以用公积金;

[要不要提前还房贷?想听听大家的想法]
• 我的初步想法是不提前还,主要考虑:
① 每月还款六千多压力不大,提前还个 10 万进去,大概算了算每个月也就少个 500 左右,但是手里得直接减少 10 万现金;
② 钱会越来越不值钱,以后的六千多更不值得一提;
③ 收入还可以,房贷可以抵一部分个人所得税;
• 不过翻了下 V2 ,好像大多数人还是倾向于降低负债。
结合我这个情况,大家觉得有没有必要提前还一部分?欢迎交流~

广州外企 - Principal Data Framework Engineer - 50-80k

8 May 2025 at 22:19
felixchen1314: 福利:每周 3 天 WFO ,2 天 WFH ,20 天年假
JD 如下:
Job Summary

The Principal Data Framework Engineer develops reusable frameworks and tools that enable teams to build pipelines and workflows efficiently. This role focuses on designing metadata-driven solutions for ETL, workflows, and data specifications, optimizing data integration processes, and ensuring seamless interaction with the platform’s core components. The Framework Engineer also implements robust data quality and integrity checks, enabling a scalable and flexible framework for data engineering tasks across the organization.
Strategy
• Framework Development: Design and implement flexible, metadata-driven frameworks for ETL, workflow orchestration, and data specifications to support efficient pipeline creation.
• Standardization: Establish best practices and reusable components for data ingestion, transformation, and processing to streamline efforts across teams.
• Metadata-Driven Design: Build frameworks leveraging metadata to define and automate ETL processes, workflows, and data specifications, ensuring flexibility and scalability.
• Data Quality Checks: Develop and integrate automated data quality checks into frameworks using tools like Great Expectations or similar solutions.
• Data Integrity Checks: Ensure frameworks include mechanisms to validate data integrity across pipelines, capturing schema changes, record counts, and column-level validations.
• Integration: Build seamless integrations with core platform components like Apache Iceberg, Spark, Kafka, Airflow, and Argo to enable consistent processing across batch and streaming workloads.
• Workflow Orchestration: Develop metadata-driven workflow orchestration frameworks to enable easy configuration and deployment of ETL processes.
• Reliability: Build frameworks with fail-safe mechanisms to handle errors and ensure reliability in pipeline execution.
• Compliance: Ensure frameworks adhere to governance policies and regulatory requirements
Key Responsibilities

Business
• Enablement: Empower data engineers and analysts with user-friendly, metadata-driven frameworks to accelerate development and ensure consistency.
• Stakeholder Alignment: Collaborate with domain and platform teams to ensure frameworks address key business and technical requirements.
People & Talent
• Collaboration: Work closely with platform and data engineers to ensure frameworks align with infrastructure capabilities and operational requirements.
• Skill Sharing: Provide technical documentation and training to engineers and analysts using the frameworks.
Governance
• Compliance & Regulatory Adherence: Ensure compliance with internal and external regulatory requirements, including data sovereignty, privacy, and resilience standards.
• Data Governance & Quality: Implement data governance policies implementation to maintain data quality, integrity, accuracy, and consistency across the platform. Implement monitoring tools to proactively address data quality issues.

Regulatory & Business Conduct
• Display exemplary conduct and live by the Group’s Values and Code of Conduct.
• Take personal responsibility for embedding the highest standards of ethics, including regulatory and business conduct, across Standard Chartered Bank. This includes understanding and ensuring compliance with, in letter and spirit, all applicable laws, regulations, guidelines and the Group Code of Conduct.
• Effectively and collaboratively identify, escalate, mitigate and resolve risk, conduct and compliance matters.
Skills and Experience

Key stakeholders
• Rest of Data & Analytics team
• WRB/CIB/GF Architecture teams
• Business and Functions Data & Analytics Team
Other Responsibilities
• Embrace and practise SCB’s brand promise of Here for Good and corporate values
• Perform other responsibilities assigned under Group, Country, Business or Functional policies and procedures
• Responsible for building a culture of good conduct
Qualifications

• Bachelor’s or Master’s degree in Computer Science, Data Engineering, or related field.
• Expertise in Python, Java, with a focus on building reusable frameworks.
• Experience with metadata-driven framework design for ETL, workflow orchestration, and data specifications.
• Proficiency in data quality and integrity tools like Great Expectations or similar solutions.
• Hands-on experience with Apache Spark, Kafka, and orchestration tools like Airflow or Argo.
• Familiarity with governance tools like Apache Ranger, OpenLineage, and DataHub.

Required skills
check
Framework Development
check
Database Development
check
Data Quality
check
Data Security
check
In-Fusion
check
Process Integration
check
System Reliability
check
Legal Compliance

有人收到过大中厂 offer 么,求一个邮件

By: 0x0x0x0
8 May 2025 at 21:50
0x0x0x0:

有偿,帮 HR 朋友求一份国内大中厂的真实 Offer 邮件(比如网易/百度/快手/小米/唯品会这种)。

1.可以是自己收到但没有接收的 offer ,可以隐藏或者修改个人信息

2.邮件内容包含薪资结构部分(可自行修改具体数字)

3.下载为 eml ,vscode 编辑一下,隐去个人信息就好咯

带样本截图微信联系。仅用于参考,不做商业用途。

weixin

最近遇到了 3 次非常难查的问题,很无助

By: zhoudaiyu
8 May 2025 at 21:25
zhoudaiyu: 本人是 sre ,负责 k8s 和一些如 kafka zk 的中间件的运维,最近遇到了 3 个问题好久都没查出来。第一次是 3 节点 zk 集群夜间突然 1 台 cpu 拉到 100%几分钟后 cpu 掉下来了,但节点不可用,然后 2 个小时后另外一台又这样了,也挂了,然后集群不可用了。第二次是 6 节点 kafka 突然有一台 cpu 很高,重启没用,停掉后部分业务又开始报错,提高 cpu 配置(容器),并迁移了受影响的一个业务后启动后突然就一切正常,cpu 使用率也没那么高了,其他业务也没事了。第三个是 docker info 、docker images 突然 hang 住,几个小时自己恢复了,然后又开始反复。这几次中间件除了 zk 那个日志被清理了看不到当时报错,其他都没有什么报错,无从查起,很无力,领导 又要结果。

接了个单,想问一下有没有法律风险?

By: psyer
8 May 2025 at 21:16
psyer: 在某个群接了个单,要完成的需求是:他们给我一点广告链接,让我用 Python 脚本模拟用户去点击,服务器在海外,提升 Google Ads 的点击率,大概就是这样,每天可能有 1000-2000 次点击。海外服务器等资源他那边提供,我只提供脚本。



简单来说就是模拟用户去点击广告链接,主要是海外跨境电商,海外环境。这种行为存在法律风险吗?违法吗?

双持 ios 和 android, app 同步怎么处理

By: leosj
8 May 2025 at 20:55
leosj:

比如抖音,taobao 这些可以同时登陆,qq ,微信不能同时登陆,网上有 pad 版本的,但是怕封号,有没有同步消息的,比如我 ios 登陆微信 A ,安卓登陆微信 B ,A 收到消息,就推送到微信 B ,B 收到消息就推送微信 A ,感觉这样做还没有 pad 版本那种好

做了个 llms.txt 生成器,据说对 SEO 有好处

By: HackerQED
8 May 2025 at 20:51
HackerQED: 道听途说这玩意对 SEO 大有好处,有个老哥靠这个从 chatbot 一个月拿了几千流量。

感觉这玩意会流行起来,也是自己手里小站太多,懒得一个个写,就做了个生成器: http://llmstxtgenerator.co

免登陆使用,限制了最多抓 5 个页面,怕网友把我拉爆。token 用得还挺多的。

用法:输入 sitemap ,后台抓网站内容,ai 生成 llms.txt ,大致就是一个专门写给 ai bot 的文件,包含了网站的用途和重要链接。

什么是 llms.txt: https://llmstxt.org
❌
❌