Stelle das Messinstrument auf eine Waage und man wird feststellen, dass Dieses um den Betrag M * g schwerer ist. Kühlt das Messinstrument ab, dann wiegt es wieder genauso viel wie vorher.
Das hatten wir doch schon. Was du hier als M bezeichnest, ist die Energie.
Lass das Photon auf ein
kleines Messinstrument knallen, und seine Energie erhöht sich um E. Allerdings ist es nicht mehr in Ruhe, und du kannst es nicht wiegen. Brems es ab oder lass die Waage mitfahren, und du misst einen Massenzuwachs kleiner E. Wenn M die Masse des Messinstruments ist, ist die Masse nach dem Zusammenstoß sqrt(M²+2ME).
Wenn die Geschichte abkühlt, also die Wärme isotrop abstrahlt, dann haben wir wieder Masse M.
Wenn du aber die Energie als Masse bezeichnest, so ist die "Masse" des Messgeräts nach dem Abkühlen nicht M, sondern M*(M+E)/sqrt(M²+2ME), also größer als vorher. Das suggeriert, dass sich am Messgerät selbst etwas geändert hätte, was natürlich nicht der Fall ist. Es hat njur eine Relativbewegung zum Labor, in dem es vorher in Ruhe war.
Dass deine Mathematik auch so schön nach Masse aussieht und nicht nur nach Energie liegt ausschließlich daran, dass du immer Situationen verwendest, in denen du ein bestimmtes Bezugssystem bevorzugst. Zusammen damit, dass du einen Stoßpartner so schwer wählst, dass du ihn vor und nach dem Zusammenstoß annähernd als ruhend in diesem System betrachten kannst. Spiel dasselbe Gedankenexperiment wie hier mal mit deinen Massen im Zug durch, dann wird deutlich, wo die Nachteile liegen.
EDIT:
Ich füge nochmal hinzu: Ich rede hier nicht von experimentellen Unterschieden, oder von richtig oder falsch. Es ist bloß blöd, zur Energie auch Masse zu sagen, und es verleitet zu allerlei Fehlinterpretationen, weil die ganze Denkweise dahinter die SRT als Modifikation der Newtonschen Theorie betrachtet. Das ist sie aber nicht. Deswegen hat sich mittlerweile die Sprachregelung durchgesetzt, die ich hier vertrete. Worte schaffen Bilder, und die sollten brauchbare sein.