Python有以下三个特点:
易用性和灵活性全行业高接受度:Python无疑是业界最流行的数据科学语言用于数据科学的Python库的丰富数量优势
本文介绍了python人最常用的59个python库。一起来看看吧~
用于数据收集的Python库
1.BeautifulSoup-是一个HTML和XML解析器,可为被解析的页面创建解析树,从而用于从web页面中提取数据
2.Scrapy-一个可有效用于网页抓取的Python库
3.Selenium一个用于大规模网页抓取的框架
用于数据清理和数据操作的Python库
4.Pandas-主要用于数据操作和数据分析
5.PyOD-是一个全面的、可伸缩的Python工具包,用于检测外围对象
6.NumPy-引入了支持大型多维数组和矩阵的函数,同时还引入了高级数学函数来处理这些数组和矩阵
7.Spacy-一个非常有用且灵活的自然语言处理(NLP)库和框架,用于清理创建模型的文本文档
用于数据可视化的Python库
8.Matplotlib-是Python中最流行的数据可视化库,Python2D绘图库
9.Seaborn-一个基于matplotlib的绘图库
10.Bokeh-一个面向现代网页浏览器的交互式可视化库
11.plotly–协同Python和matplotlib工作的web绘图库。
用来进行科学计算和数据分析的库
12.bcbio-nextgen–这个工具箱为全自动高通量测序分析提供符合最佳实践的处理流程。
13.blaze–NumPy和Pandas的大数据接口。
14.cclib–一个用来解析和解释计算化学软件包输出结果的库。
15.NetworkX–一个为复杂网络设计的高性能软件。
16.Neupy–执行和测试各种不同的人工神经网络算法。
17.Numba–PythonJIT(justintime)编译器,针对科学用的Python,由Cython和NumPy的开发者开发。
18.NumPy–使用Python进行科学计算的基础包。
19.OpenMining–使用Python挖掘商业情报(BI)(Pandasweb接口)。
20.orange–通过可视化编程或Python脚本进行数据挖掘,数据可视化,分析和机器学习。
21.Pandas–提供高性能,易用的数据结构和数据分析工具。
22.PyDy–用来为动力学运动建模工作流程提供帮助
23.SciPy–用于数学,科学和工程的开源软件构成的生态系统。
24.statsmodels–统计建模和计量经济学。
25.SymPy–一个用于符号数学的Python库。
26.zipline–一个Python算法交易库。
用于建模的Python库
27.Scikit-learn-是Python构建模型中的佼佼者
28.TensorFlow-是一个流行的深度学习库,可帮助构建、培训不同模型
29.PyTorch-一个基于Python的科学计算包
用于模型解释的Python库
30.Lime-是一种算法(库),可以解释任何分类器或回归量的预测
31.H2O-无人驾驶AI,提供简单的数据可视化技术
用于语音处理的Python库
32.Librosa-一个用于音乐和音频分析的Python库
33.Madmom-一个用于音频数据分析的很棒的Python库
34.pyAudioAnalysis-一个用于音频特征提取、分类和分段的Python库
用于图像处理的Python库
35.OpenCV-Python-主要用于解决计算机视觉问题
36.Scikit-image-用于执行多个不同图像处理任务的算法集合。可用于图像分割、几何变换、色彩空间操作、分析、过滤,形态学、特征检测等等
37.Pillow-是一个更加易用版的PIL
作为数据库的Python库
38.Psycopg-是Python编程语言中最流行的PostgreSQL(高级开源代码关系数据库)适配器
39.SQLAlchemy-SQL是最流行的数据库语言。SQLAlchemy是pythonSQL工具包和对象关系映射器。
用于WEB的Python库
40.Flask-一个用Python编写的Web框架,广泛用于部署数据科学模型
41.Requests:-优雅,简单,人性化的HTTP库
42.HTTPie-人性化的类似cURL命令行的HTTP客户端
43.ProxMon:-处理代理日志和报告发现的问题
44.WSMap:--寻找Web服务器和发现文件
45.Twill:--从命令行界面浏览网页。支持自动化网络测试
用于文本处理的Python库
46.Chardet–字符编码检测器,兼容Python2和Python3。
47.Ftfy–让Unicode文本更完整更连贯。
48.Unidecode–Unicode文本的ASCII转换形式。
49.Xpinyin–一个用于把汉字转换为拼音的库。
50.difflib–(Python标准库)帮助我们进行差异化比较。
51.fuzzywuzzy–模糊字符串匹配。
用于特殊文本格式处理的Python库
52.tablib–一个用来处理中表格数据的模块。
53.PDFMiner–一个用于从PDF文档中抽取信息的工具。
54.PyPDF2–一个可以分割,合并和转换PDF页面的库。
55.openpyxl–一个用来读写Excelxlsx/xlsm/xltx/xltm文件的库
56.XlsxWriter–一个用于创建Excel.xlsx文件的Python模块
用于集成开发环境的Python库
57.PyCharm–商业化的PythonIDE,由JetBrains开发。也有免费的社区版提供。
58.LiClipse–基于Eclipse的免费多语言IDE。使用PyDev来支持Python。
59.Spyder–开源PythonIDE。
总结
当然,这里总结的库可以说只是python库的冰山一角。如果你遇到问题,那么请第一时间去查找python的第三方扩展库,因为90%以上的问题,python强大的扩展库都能解决。
(PS:如果觉得有用,点赞收藏走一波吧~)