df = pd.DataFrame(
{
"col1": ["a", "a", "b", "b", "a"],
"col2": [1.0, 2.0, 3.0, np.nan, 5.0],
"col3": [1.0, 2.0, 3.0, 4.0, 5.0],
},
columns=["col1", "col2", "col3"],
)
df
df2 = df.copy()
df2.loc[0, "col1"] = "c"
df2.loc[2, "col3"] = 4.0
df2.loc[3, "col2"] = 4.0
df2
df.compare(df2)
nan
比較についても検知可能。axis=0
で行で分ける
df.compare(df2, align_axis=0)
keep_shape=True
で元のレイアウト保持で出力できる。
df.compare(df2, keep_shape=True)
keep_equal=True
で一致した内容も出力する。(いまいち利用方が思いつかない)
df.compare(df2, keep_shape=True, keep_equal=True)