Star3687:
项目概述
我们正在寻找经验丰富的算法工程师,参与开发先进的银行信贷业务材料合规性检测模型及生产工具。主要用于地方商业银行的信贷业务风控、合规检查。
核心职责
图像篡改检测算法开发
1)开发银行流水单、票据、证件等信贷业务佐证材料的图像篡改检测算法
2)实现基于深度学习的图像篡改识别模型
3)构建多模态融合的图片篡改验证系统
文本文件格式合规检测算法开发
1)设计多格式文档结构解析和验证算法
2)开发业务规则引擎和数据格式校验系统
3)实现智能化的格式异常识别系统
垂直领域大模型开发
1)基于金融领域数据训练专用 NLP 大模型
2)开发文档逻辑一致性检验算法
3)实现智能化的异常模式识别
系统集成与部署
1)设计微服务架构的检测系统
2)完成 Linux 服务器环境的部署适配
3)实现高性能、高可用的生产环境部署
技术栈要求
机器学习与深度学习
a.深度学习框架: PyTorch, TensorFlow 2.x
b.计算机视觉: OpenCV, PIL, scikit-image
c.图像处理: 图像增强、特征提取、对抗样本检测
d.模型架构: CNN, ResNet, EfficientNet, Vision Transformer
自然语言处理
a.大模型技术: Transformers, BERT, GPT 系列, LLaMA
b.NLP 框架: Hugging Face, spaCy, NLTK
c.向量化技术: Word2Vec, FastText, Sentence-BERT
d.文本分析: 语义分析、情感分析、异常检测
后端开发技术
a.编程语言: Python 3.8+, Go/Java
b.Web 框架: FastAPI, Flask, Django
c.数据库: PostgreSQL, MySQL, MongoDB, Redis
d.消息队列: RabbitMQ, Apache Kafka
云计算与部署
a.容器化: Docker, Kubernetes
b.Linux 系统: Ubuntu, CentOS, 熟悉 Shell 脚本
c.CI/CD: Jenkins, GitLab CI, GitHub Actions
d.监控运维: Prometheus, Grafana, ELK Stack
数据处理与存储
a.大数据技术: Apache Spark, Hadoop (加分项)
b.数据处理: Pandas, NumPy, Dask
c.特征工程: scikit-learn, Feature-engine
d.模型服务: MLflow, TensorFlow Serving, TorchServe
文档格式处理
a.文档解析: PyPDF2, python-docx, openpyxl, lxml
b.格式验证: JSON Schema, XML Schema, Cerberus
c.正则表达式: re, regex, 复杂模式匹配
d.业务规则引擎: PyKE, Experta, 自定义规则解析器
Linux 部署环境要求
a.操作系统: Ubuntu 20.04 LTS / CentOS 8+
b.Python 环境: Python 3.8+ with conda/virtualenv
c.GPU 支持: CUDA 11.x + cuDNN 8.x
d.内存要求: 32GB+ RAM (模型推理需求)
e.存储空间: 500GB+ SSD (模型和数据存储)
岗位要求
技术能力
1)5 年以上机器学习/深度学习项目经验
2)熟悉计算机视觉和自然语言处理算法
3)具备大模型训练和微调经验
4)精通 Python 及相关机器学习库
5)熟悉 Linux 系统管理和 Docker 部署
领域经验(优先)
1)金融科技或风控系统开发经验
2)文档图像处理和 OCR 技术经验
3)文档格式标准化和合规检测系统经验
4)反欺诈或异常检测系统开发经验
5)大规模机器学习系统部署经验
软技能
1)强烈的技术责任心和安全意识
2)良好的代码规范和文档习惯
3)具备独立解决复杂技术问题的能力
4)优秀的沟通协调能力
看这里:
vx:baixiangguo99999999
请备注 银行材料检测算法