python

pandas.DataFrame.nunique

test.csv

col1,col2,col3,col4
00,11,02,03
10,11,22,13
20,11,22,33
30,11,22,33

example1


import pandas as pd
df = pd.read_csv("test.csv")
print(df['col1'].nunique())
print(df['col2'].nunique())
print(df['col3'].nunique())
print(df['col4'].nunique())

#4
#1
#2
#3

pandas.DataFrame.isnull

test.csv

col1,col2,col3,col4
00,01,02,03
10,11,12,13
20,21,22,23
30,31,32,33
, , ,
, ,,

example1

import pandas as pd
df = pd.read_csv("test.csv")
print(df.isnull())

#    col1   col2   col3   col4
#0  False  False  False  False
#1  False  False  False  False
#2  False  False  False  False
#3  False  False  False  False
#4   True  False  False   True
#5   True  False   True   True

pandas.DataFrame.astype

test.csv

col1,col2,col3
00,01,02
10,11,12
20,21,22
30,31,32

example1

import pandas as pd
df = pd.read_csv("test.csv")
print(df['col3'].astype(float))

#0     2.0
#1    12.0
#2    22.0
#3    32.0

pandas.DataFrame.shape

test.csv

col1,col2,col3
00,01,02
10,11,12
20,21,22
30,31,32

example1

import pandas as pd
df = pd.read_csv("test.csv")
print(df.shape)

#(4, 3)

pandas.read_csv

pandas.read_csv

pandas 0.23.4

pandas.read_csv(filepath_or_buffer,encoding=None, usecols=None, header=’infer’, names=None)
filepath_or_buffer:CSVファイルのパス
encoding:エンコードの指定
usecols:取得するカラム(列)の指定
header: ヘッダーの行を指定
names: カラム名を指定

test.csv

col1,col2,col3,col4
00,01,02,03
10,11,12,13
20,21,22,23
30,31,32,33

example1

import pandas as pd
df = pd.read_csv("test.csv")
print(df)

#   col1  col2  col3  col4
#0     0     1     2     3
#1    10    11    12    13
#2    20    21    22    23
#3    30    31    32    33

example2

import pandas as pd
df = pd.read_csv("test.csv", encoding="utf-8")
print(df)

#   col1  col2  col3  col4
#0     0     1     2     3
#1    10    11    12    13
#2    20    21    22    23
#3    30    31    32    33

example3

import pandas as pd
df = pd.read_csv("test.csv", usecols=[0, 1])
print(df)

#   col1  col2
#0     0     1
#1    10    11
#2    20    21
#3    30    31

test.csv

00,01,02,03
col1,col2,col3,col4
10,11,12,13
20,21,22,23
30,31,32,33

example4

import pandas as pd
df = pd.read_csv("test.csv", header=1)
print(df)

#   col1  col2  col3  col4
#0    10    11    12    13
#1    20    21    22    23
#2    30    31    32    33

test.csv

col1,col2,col3,col4
00,01,02,03
10,11,12,13
20,21,22,23
30,31,32,33

example5

import pandas as pd
names = ['apple', 'orange', 'lemon', 'banana']
df = pd.read_csv("test.csv", header=0, names=names)
print(df)

#   apple  orange  lemon  banana
#0      0       1      2       3
#1     10      11     12      13
#2     20      21     22      23
#3     30      31     32      33

すぐに使える! 業務で実践できる! Pythonによる AI・機械学習・深層学習アプリのつくり方

すぐに使える! 業務で実践できる! Pythonによる AI・機械学習・深層学習アプリのつくり方
クジラ飛行机 杉山 陽一 遠藤 俊輔
ソシム
売り上げランキング: 5,934

久しぶりに非常に読み応えのある本だった。

機械学習を使ったケーススタディーがあったのでこれをベースに実務に生かしたい。

なお、Appendixを見ながらdockerでパッケージをインストールする場合にこけてしまう時があって、「sudo apt-get update」を実行して解決させました。

また、tensorflowを使ったソースコードで「summary_writer = tf.summary.FileWriter(‘./logs’, sess.graph)」だけでは動かず、そのあとに、「summary_writer.flush()」を追記することで正常に動作させることができた。

2018年7月の初版本を購入したが上記に加えてサンプルコードのいくつかが動かない部分があるので、自分を疑う前に、
『すぐに使える!業務で実践できる!Pythonによる AI・機械学習・深層学習アプリのつくり方』のサポートページ
で確認してから、写生したソースを疑った方がいいかもです。