数据分析-实验
混乱的实验室:Te-s-r-act,是 TensorAct,还是 Tesseract ?
混乱的实验室:Te-s-r-act,是 TensorAct,还是 Tesseract ?
pandas是一个数据处理的包,本身提供了许多读取文件的函数,像read_csv(读取csv文件),read_excel(读取excel文件)等,只需一行代码就能实现文件的读取。
第一步:去指数转线性,y = LN(x/x的几何平均数), 第二步:Logistic 模式 ,y = 1/(1+e^(-x)) 第三步:z-score 标准化,y=(x-μ)/σ
只要经过这三步处理,不管之前是怎样分布的数据,都会转化为标准正态分布。
安装了Anaconda,借助Anaconda 安装了 Jupyter Notebook,Jupyter Lab,Numpy,Pandas,SciPy,TensorFlow,Keras 还有matplotlib,差点忘了
不学了,要吐了
再想想
找到了英文版
找到了中文版
pandas是一个数据处理的包,本身提供了许多读取文件的函数,像read_csv(读取csv文件),read_excel(读取excel文件)等,只需一行代码就能实现文件的读取。
CSV
读取 CSV 文件数据:
Excel
写入 Excel 文件:
读取 Excel 文件:
Series 是一种一维数组,和 NumPy 里的数组很相似。事实上,Series 基本上就是基于 NumPy 的数组对象来的。和 NumPy 的数组不同,Series 能为数据自定义标签,也就是索引(index),然后通过索引来访问数组中的数据。
创建一个 Series 的基本语法如下:
Pandas 的 DataFrame(数据表)是一种 2 维数据结构,数据以表格的形式存储,分成若干行和列。通过 DataFrame,你能很方便地处理数据。常见的操作比如选取、替换行或列的数据,还能重组数据表、修改索引、多重筛选等。
构建一个 DataFrame 对象的基本语法如下:
numpy
np.array # ndarray
scipy
scipy.stats
pandas
Series,DataFrame
excel,csv
matplotlib
tensorflow
keras
IPython
Spyder
Jupyter Notebook/Lab
PyCharm
作者:Adrien Chauve, Andre Espaze, Emmanuelle Gouillart, Gaël Varoquaux, Ralf Gommers
Scipy
scipy
包包含许多专注于科学计算中的常见问题的工具箱。它的子模块对应于不同的应用,比如插值、积分、优化、图像处理、统计和特殊功能等。
scipy
可以与其他标准科学计算包相对比,比如GSL (C和C++的GNU科学计算包), 或者Matlab的工具箱。scipy
是Python中科学程序的核心程序包;这意味着有效的操作numpy
数组,因此,numpy和scipy可以一起工作。
在实现一个程序前,有必要确认一下需要的数据处理时候已经在scipy中实现。作为非专业程序员,科学家通常倾向于重新发明轮子,这产生了小玩具、不优化、很难分享以及不可以维护的代码。相反,scipy的程序是优化并且测试过的,因此应该尽可能使用。
警告 这个教程根本不是数值计算的介绍。因为列举scipy的不同子模块和功能将会是非常枯燥的,相反我们将聚焦于列出一些例子,给出如何用scipy进行科学计算的大概思路。
scipy是由针对特定任务的子模块组成的:
向量计算 / Kmeans
物理和数学常量
傅里叶变换
积分程序
插值
数据输入和输出
线性代数程序
n-维图像包
正交距离回归
优化
信号处理
稀疏矩阵
空间数据结构和算法
一些特殊数学函数
统计
In [1]:
scipy
的主要命名空间通常包含的函数其实是numpy(试一下scipy.cos
其实是np.cos
) 。这些函数的暴露只是因为历史原因;通常没有必要在你的代码中使用import scipy
。
课程?。
找到了 ,发现逻辑回归分类问题应该用交叉熵损失函数,而不是均方误差MSE损失函数
**** | **** | (Softmax函数)
学会复制粘贴了,这是一种进步
找到了python基础教程,重新回去学python
找到了一本书:利用Python进行数据分析:
****
🚩
。
详见 文档。
详见文档。
DataFrame 的 方法可以快速绘制所有带标签的列:
\
NumPy 提供了很多,用于从数组中查找最小元素,最大元素,百分位标准差和方差等。
🚩
他们全都依赖于, 但是大多数是彼此独立的。导入Numpy和Scipy的标准方式:
🚩
🚩
🚩
****🚩
🚩
源码下载链接:
pandas.concat()通常用来连接DataFrame对象。
**loc:**通过行标签索引数据 **iloc:**通过行号索引行数据 **ix:**通过行标签或行号索引数据(基于loc和iloc的混合)
🚩