Clustern nach WARD: Effizientes Speichern der Clusterschritte
Allgemeine Fragen zu SAS |
Eingetragen von SAS-User. | 9 März, 2008 - 11:39
Ich habe einen Algorithmus zum Clustern nach WARD geschrieben. Bislang schreibe ich die Clusterschritte in Strings. Das ist nicht sehr effizient, besonders dann, wenn man viele IDs hat.
Bei jedem Clusterschritt liegen vor: id, lagid, idNew and minid
id lagid idNew minid 1 . 2 1 1_2 . 3 2 2_3 1 4 3 3_4 . 5 4 4_5 .
Die idNew, die zu dem gerinsten Informationsverlust durch das Clustern führt, wird gewählt und mit minid=1 markiert. Dann erhält man
id lagid .... 1 . 2_3 1 4 2_3 5 4
und am Ende des Clusterns z.B.
id lagid idNew 1 . . 2_3_4_5 1 1_2_3_4_5
Wie kann ich die Information in id, lagid und idNew effizienter speichern als jeweils in einem String, der sehr lang werden kann?
Vielen Dank für Eure Hilfe.
SAS-User.
