pandas,numpy,matplotlib

1
2
3
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

pandas

加载数据到DataFrame:

  • path = ‘ex1data1.txt’ # 创建字符串变量
  • data = pd.read_csv(path, header=None, names=[‘Population’, ‘Profit’]) #header:文件本身的列标题行,为none即第一行就是数据
1
2
data.head() #显示DataFrame的前5行
data.describe() #自动计算各列统计值

绘图

1
2
data.plot(kind='scatter', x='Population', y='Profit', figsize=(10,6))\
plt.show() #显示图形

数据集插入一列

1
data.insert(0, 'Ones', 1) #对date这个DataFrame在第一列插入新列,名称Ones,值为1

numpy

向量内每个元素平方
np.power(…, 2)

所有元素求和
np.sum(inner)
指定按列求和
np.sum(数组, axis=0)

将数组转换为矩阵
np.matrix

看A的维度

1
A.shape#A为数组或矩阵,矩阵和二维数组的区别

初始化矩阵

1
np.matrix(np.zeros(theta.shape))