spezielle Summen bilden und proc corr
Hallo Forum,
ich hab hier eine echte Herausforderung, die ich zur Zeit mit meinem Know-How in SAS, nicht bewältigen kann. Leider geht es hier auch noch um meine Diplomarbeit und brauche dringend eure Hilfe. Folgende SAS-Datei ist gegeben: es befinden sich 10 Variablen (leb1-leb10) in der Datei, wobei jede Variable 50 Beobachtungen besitzt, insgesamt haben wir eine 10 x 50 Datenmatrix. Ich habe dann eine neue Variable eingeführt, die SUMME heißt und die die Summe jeder einzelnen Zeile bildet. Aufgabe ist es mittels proc corr die Variable zu finden die am meisten zur gesamten Summe beiträgt. Wende ich die Prozedur proc corr an, so erhalte ich 10 Korrelationskoeffizienten, wobei einer maximal ist und die gesuchte Variable darstellt. Nachdem ich die erste Variable, beispielsweise Variable5, identifiziert habe, suche ich nach einer zweiten Variable die nun am meisten zur gesamten Summe beiträgt. Absolut FALSCH wäre es nun über den 9 verbliebenen Variablen eine weitere Korrelation zu berechen. Das ist nicht was mein Algorithmus machen soll, wär auch zu einfach! Es muss die zuerst identifizierte Variable separat mit den übriggebliebenen Variablen addiert werden. D.h.
Variable5+Variable1
Variable5+Variable2
.
.
.
Variable5+Variable10
Anschließend wird wiederum eine Korrelation zwischen den Summen (Variable5+Varianble1...Variable5+Variable10) und der Variablen SUMME berechnet. Nun habe ich 9 (da Variable5+Variable5 nicht benötigt wird) Ergebnisse und wiederum einen maximalen Wert und habe somit die zweite Variable identifiziert die zusammen mit der ersten Variablen (hier Variable5) am meisten zur gesamten Summe beiträgt. Hat SAS die zweite Variable gefunden geht das Spielchen von vorne los, d.h. welche Variable ergibt zusammen mit den nun ersten beiden Variablen den maximalen Koeffizienten? Das PROBLEM ist, wie greift SAS automatisch auf die erste berechnete Variable zu bzw. auf die erste und zweite usw. und berechnet dann die Summen mit den anderen übriggebliebenen Variablen? D.h doch, das SAS so etwas wie ein Gedächnis braucht um sich die berechneten Variablen zu merken um dann weitere Berechnungen.
Für euer Bemühen bedanke ich mich jetzt schon.
Daniel Czech
