关于我
一名大数据与机器学习方向的开发者,热衷于把工作和学习中遇到的问题记录下来。
从学生时代做手写识别、爬取拉勾网数据做毕设,到工作中用 Spark 跑模型、搭图数据库集群、处理各种生产环境的踩坑问题——这些经历都沉淀在这个博客里。
技术栈
大数据
- Spark / PySpark / Scala
- HBase / HDFS / MapReduce
- Redis
机器学习
- 随机森林、GBDT、线性回归等经典算法
- 熵权法、特征工程
- 负荷预测建模实践
图数据库
- Neo4j(集群部署)
- Nebula Graph(踩坑后弃坑)
编程语言 & 工具
- Python(Flask、PyQt5、OpenCV、PyInstaller)
- Linux / Git / Vim
- ElasticSearch
关于这个博客
StudyFlow Blog — 记录学习与工作的流动。
内容涵盖:
- 大数据与机器学习的技术笔记
- 工作中踩过的坑和解决方案
- 偶尔的生活记录
不追求完美,只求真实有用。
联系
如果你有问题或想法,欢迎通过 GitHub Issues 或留言交流。