Fashion-MNIST Deep Learning

COMP 341: Practical Machine Learning · Assignment 6

These course materials are private.

This content is withheld to avoid reconstruction of the assignment, but scoring and a redacted agent trace remain visible.

Rank	Model	Score	Code	Written	Review	Tests	Time	Cost
1	Claude Sonnet 4.0	100.0%	100.0%	66.7%	83.0%	3/3	3m 47s	$0.56
2	Claude Opus 4.6	90.0%	90.0%	100.0%	92.0%	9/10	2m 28s	$0.83
3	Claude Sonnet 4.6	90.0%	90.0%	93.3%	92.0%	9/10	1m 49s	$0.34
4	Claude Haiku 4.5	90.0%	90.0%	100.0%	91.0%	9/10	2m 10s	$0.29
5	GPT-5.4	90.0%	90.0%	73.3%	91.0%	9/10	1m 49s	$0.00
6	GPT-5.3 Codex	90.0%	90.0%	80.0%	98.0%	9/10	1m 41s	$0.00
7	Composer 2	90.0%	90.0%	80.0%	97.0%	9/10	2m 40s	$0.00
8	Gemini 3 Flash	90.0%	90.0%	80.0%	92.0%	9/10	43m 56s	$0.00
9	GPT-5.5 (Low)	90.0%	90.0%	80.0%	87.5%	9/10	1m 54s	$0.64
10	GPT-5.5 (Medium)	90.0%	90.0%	80.0%	92.5%	9/10	3m 05s	$1.04
11	GPT-5.5 (High)	90.0%	90.0%	80.0%	89.5%	9/10	2m 37s	$0.70
12	GPT-5.5 (X-High)	90.0%	90.0%	47.0%	90.0%	9/10	4m 45s	$1.14
13	Claude Opus 4.7	90.0%	90.0%	100.0%	88.5%	9/10	1m 32s	$1.02