re-ran the tests

2026-05-14 22:16:57 +00:00 · 2025-04-21 22:34:51 -04:00
parent 23899c703f
commit ebc64d766f
95 changed files with 2446 additions and 74 deletions
@@ -15,6 +15,7 @@ import pandas as pd
 import matplotlib.pyplot as plt
 import statsmodels.api as sm
 from statsmodels.formula.api import ols
+from argparse import Namespace

 # simple cnn model definition
 # I looked a lot at https://github.com/giusarno/SimpleCNN/blob/master/examples/cifar10/themodel.py
@@ -24,14 +25,18 @@ from statsmodels.formula.api import ols
 class SimpleCNN(nn.Module):
 	def __init__(self, num_classes=10):
 		super(SimpleCNN, self).__init__()
+		DROPOUT_RATE = 0.2
+
 		self.features = nn.Sequential(
 			nn.Conv2d(3, 32, 3, padding=1), nn.ReLU(),
 			nn.MaxPool2d(2),
 			nn.Conv2d(32, 64, 3, padding=1), nn.ReLU(),
 			nn.MaxPool2d(2),
 		)
+
 		self.classifier = nn.Sequential(
 			nn.Flatten(),
+			nn.Dropout(DROPOUT_RATE),
 			nn.Linear(64 * 8 * 8, 128), nn.ReLU(),
 			nn.Linear(128, num_classes),
 		)
@@ -60,7 +65,7 @@ def get_data_loaders(batch_size, augmentation):
 			transforms.RandomRotation(15),
 			transforms.RandomCrop(32, padding=4),
 			transforms.ColorJitter(brightness=0.2, contrast=0.2,
-			                       saturation=0.2, hue=0.1),
+								   saturation=0.2, hue=0.1),
 			transforms.ToTensor(),
 		])
 	else:
@@ -84,16 +89,21 @@ def get_data_loaders(batch_size, augmentation):


 # train for 1 epoch
-
-
-def train_one_epoch(model, optimizer, criterion, dataloader, device):
+def train_one_epoch(model, optimizer, criterion, dataloader, device, aug=True):
 	model.train()
 	running_loss = 0.0
 	correct = 0
 	total = 0
+
 	for inputs, targets in dataloader:
 		inputs, targets = inputs.to(device), targets.to(device)
 		optimizer.zero_grad()
+
+		if aug:
+			noisstd = np.random.uniform(0, 0.2)
+			inputs = inputs + noisstd * torch.randn_like(inputs)
+			# inputs = torch.clamp(inputs, 0.0, 1.0)
+
 		outputs = model(inputs)
 		loss = criterion(outputs, targets)
 		loss.backward()
@@ -103,14 +113,13 @@ def train_one_epoch(model, optimizer, criterion, dataloader, device):
 		_, predicted = outputs.max(1)
 		correct += predicted.eq(targets).sum().item()
 		total += targets.size(0)
+
 	epoch_loss = running_loss / total
 	epoch_acc = correct / total
 	return epoch_loss, epoch_acc


 # eval on clean data
-
-
 def evaluate(model, criterion, dataloader, device):
 	model.eval()
 	running_loss = 0.0
@@ -132,8 +141,6 @@ def evaluate(model, criterion, dataloader, device):


 # eval robustness under gaussian noise
-
-
 def evaluate_robustness(model, dataloader, device, noise_std):
 	model.eval()
 	correct = 0
@@ -141,8 +148,9 @@ def evaluate_robustness(model, dataloader, device, noise_std):
 	with torch.no_grad():
 		for inputs, targets in dataloader:
 			noisy_inputs = inputs + noise_std * torch.randn_like(inputs)
-			noisy_inputs = torch.clamp(noisy_inputs, 0.0, 1.0)
+			# noisy_inputs = torch.clamp(noisy_inputs, 0.0, 1.0)
 			noisy_inputs, targets = noisy_inputs.to(device), targets.to(device)
+
 			outputs = model(noisy_inputs)
 			_, predicted = outputs.max(1)
 			correct += predicted.eq(targets).sum().item()
@@ -152,50 +160,52 @@ def evaluate_robustness(model, dataloader, device, noise_std):


 def analyze_results(results_path='results.json'):
-    import json
-    import pandas as pd
-    import matplotlib.pyplot as plt
-    from statsmodels.formula.api import ols
-    import statsmodels.api as sm
+	with open(results_path) as f:
+		results = json.load(f)
+	df = pd.DataFrame(results)
+	df.to_csv('analysis_results.csv', index=False)

-    with open(results_path) as f:
-        results = json.load(f)
-    df = pd.DataFrame(results)
-    df.to_csv('analysis_results.csv', index=False)
+	# full ANOVA w/interaction
+	model = ols('test_acc ~ C(optimizer) * C(augmentation)', data=df).fit()
+	anova_table = sm.stats.anova_lm(model, typ=2)
+	print('anova on test accuracy:')
+	print(anova_table)

-    # full ANOVA w/interaction
-    model = ols('test_acc ~ C(optimizer) * C(augmentation)', data=df).fit()
-    anova_table = sm.stats.anova_lm(model, typ=2)
-    print('anova on test accuracy:')
-    print(anova_table)
-
-    # composite label
-    df['condition'] = df['optimizer'] + '_' + df['augmentation']
-    df.plot.bar(x='condition', y='test_acc', rot=45)
-    plt.ylabel('test accuracy')
-    plt.tight_layout()
-    plt.savefig('test_acc_comparison.png')
-    print('saved plot to test_acc_comparison.png')
+	# composite label
+	df['condition'] = df['optimizer'] + '_' + df['augmentation']
+	df.plot.bar(x='condition', y='test_acc', rot=45)
+	plt.ylabel('test accuracy')
+	plt.tight_layout()
+	
+	# ripped off the py docs --> viridis colormap for bars
+	colors = plt.cm.viridis(np.linspace(0.2, 0.8, len(df)))
+	ax = df.plot.bar(x='condition', y='test_acc', rot=45, color=colors)
+	plt.ylabel('test accuracy')
+	plt.tight_layout()
+	plt.savefig('test_acc_comparison.png')
+	print('saved plot to test_acc_comparison.png')


-# main (PUBLIC STATIC VOID AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA)
 def run_experiments(args):
 	device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
 	results = []

 	optimizers = {
-		'sgd': lambda params: optim.SGD(params, lr=args.lr, momentum=0.9),
-		'adam': lambda params: optim.Adam(params, lr=args.lr)
+		'sgd': lambda params: optim.SGD(params, lr=args.lr, momentum=0.9, weight_decay=1e-3),
+		'adam': lambda params: optim.Adam(params, lr=args.lr, weight_decay=1e-3)
 	}
 	augmentations = ['none', 'standard', 'aggressive']

 	seeds = [42, 123, 999]
 	for seed in seeds:
+		print("SEED", seed)
 		torch.manual_seed(seed)
 		np.random.seed(seed)
+
 		for opt_name in optimizers:
 			for aug in augmentations:
 				train_loader, test_loader = get_data_loaders(args.batch_size, aug)
+				noise_levels = [0.1, 0.2, 0.3]
 				model = SimpleCNN(num_classes=10).to(device)
 				optimizer = optimizers[opt_name](model.parameters())
 				criterion = nn.CrossEntropyLoss()
@@ -207,6 +217,7 @@ def run_experiments(args):
 				for epoch in range(args.epochs):
 					train_loss, train_acc = train_one_epoch(
 						model, optimizer, criterion, train_loader, device)
+
 					test_loss, test_acc = evaluate(
 						model, criterion, test_loader, device)

@@ -217,15 +228,15 @@ def run_experiments(args):
 					history['test_acc'].append(test_acc)

 					print(f"[{opt_name}][{aug}][epoch {epoch + 1}] "
-                                            f"train_loss={train_loss:.4f}, train_acc={train_acc:.4f}, "
-                                            f"test_acc={test_acc:.4f}")
+											f"train_loss={train_loss:.4f}, train_acc={train_acc:.4f}, "
+											f"test_acc={test_acc:.4f}")

-				noise_levels = [0.1, 0.2, 0.3]
 				robustness = {noise: evaluate_robustness(
 					model, test_loader, device, noise) for noise in noise_levels}

 				pd.DataFrame(history).to_csv(
-                                    f"history_{opt_name}_{aug}_{seed}.csv", index=False)
+					f"analysis/history_{opt_name}_{aug}_{seed}.csv", index=False)
+
 				results.append({
 					'seed': seed,
 					'optimizer': opt_name,
@@ -245,11 +256,15 @@ if __name__ == '__main__':

 	parser.add_argument('--batch_size', type=int, default=128)
 	parser.add_argument('--lr', type=float, default=0.01)
-	parser.add_argument('--epochs', type=int, default=10)
+	parser.add_argument('--epochs', type=int, default=20)
 	parser.add_argument('--analyze', action='store_true',
-	                    help='run analysis on results')
+						help='run analysis on results')

 	args = parser.parse_args()
+	print(json.dumps(vars(args)))
+	print(args)
+	# args = Namespace(batch_size=128, lr=0.01, epochs=20, analyze=False)
+	# exit(1)

 	if args.analyze:
 		analyze_results()