mlessentials/Lab05/Exercise5.01/Test5.01.py

import unittest
import import_ipynb
import pandas as pd
import pandas.testing as pd_testing
from sklearn.cluster import KMeans

class Test(unittest.TestCase):
	def setUp(self):
		import Exercise5_1
		self.exercises = Exercise5_1

		self.file_url = '../DataSet/taxstats2015.csv'
		self.df = pd.read_csv(self.file_url, usecols=['Postcode', 'Average net tax', 'Average total deductions'])
		self.X = self.df[['Average net tax', 'Average total deductions']]
		self.kmeans = KMeans(random_state=42)
		self.kmeans.fit(self.X)
		self.y_preds = self.kmeans.predict(self.X)
		self.df['cluster'] = self.y_preds

	def test_file_url(self):
		self.assertEqual(self.exercises.file_url, self.file_url)

	def test_df(self):
		pd_testing.assert_frame_equal(self.exercises.df, self.df)

	def test_list(self):
		self.assertCountEqual(self.exercises.y_preds, self.y_preds)


if __name__ == '__main__':
	unittest.main()