OpenAIのO3数学モデルは「テストされ、誤りであることが証明された」:テストの点数が水増しされていたとされる