python编程
-
re模块split(“| .”)可以分多个分割符 - python内置split()只能分割一个分割符
- str.rjust(32, “0”) 右补零32位, str.ljust(32, “0”)左补零32位
- dataFrame做并行数据分析, 由dict创建
- pyspark-sql 类dataframe 以及BlazingSQL + RAPIDS 作为数据工程和ETL的工具,基于GPU进行矩阵运算
- multiprogressing.Pool进行apply_async()异步多进程调用,加速简单大规模数据预处理(多核cpu处理器)(共享内存Managers和管道通信pipe) 知乎:https://zhuanlan.zhihu.com/p/64702600
- docker虚拟机中log日志查看方法