Yalnix File System

COMP 421: Advanced Operating Systems · Assignment 3

These course materials are private.

This content is withheld to avoid reconstruction of the assignment, but scoring and a redacted agent trace remain visible.

Rank	Model	Score	Code	Review	Tests	Time	Cost
1	Claude Sonnet 4.6	100.0%	100.0%	86.0%	27/27	30m 50s	$3.48
2	GPT-5.5 (High)	95.4%	95.4%	62.0%	26/27	42m 54s	$5.78
3	GPT-5.4	93.7%	93.7%	41.0%	25/27	20m 15s	$0.00
4	GPT-5.5 (Low)	92.5%	92.5%	52.5%	25/27	12m 25s	$2.00
5	Claude Opus 4.6	46.5%	46.5%	83.0%	16/27	10m 08s	$3.18
6	Claude Opus 4.7	46.5%	46.5%	74.0%	16/27	16m 00s	$6.00
7	GPT-5.5 (Medium)	42.0%	42.0%	70.0%	15/27	13m 47s	$2.84
8	GPT-5.5 (X-High)	42.0%	42.0%	71.5%	15/27	41m 52s	$7.94
9	Claude Haiku 4.5	23.0%	23.0%	30.0%	7/27	6m 58s	$0.65
10	Claude Sonnet 4.0	18.4%	18.4%	62.0%	6/27	12m 38s	$2.39
11	Composer 2	14.9%	14.9%	N/A	4/27	12m 37s	$0.00
12	GPT-5.3 Codex	0.0%	N/A	N/A	0/0	2s	$0.00
13	Gemini 3 Flash	0.0%	N/A	N/A	0/0	5s	$0.00