Statistik & Data Mining

Komplexe statistische Analyseverfahren anwenden: Anwendung von SAS-Prozeduren für statistische Analysen (STAT), ökonomische und Zeitreihenmodelle (ETS), Qualitätskontrolle (QC), Operations Research (OR), Umsetzung von statistischen Verfahren mit der interaktiven Matrixsprache (IML), Data Mining mit SAS Enterprise Miner und anderen SAS-Werkzeugen, Text Mining mit SAS Enterprise Miner.

SAS Jackboot macro and balanced sampling

Hallo,

Ich möchte das Jackboot macro benutzen. Ich möchte allerdings mein Bootstrap samples nach einem bestimmten Variabel stratefiziert haben. Weiss jemand wie das geht? Ich habe gesehen das es ein Balanced Option gibt aber ich habe nicht verstanden wie man die stratifizierenden Variabel spezifizieren kann.

Vielen Dank im Voraus

S

proc surveyselect - alloc-Statement

Guten Tag!

Die Surveyselect-Prozedur finde ich etwas - sagen wir - verwirrend. In der SAS-Doku steht, dass man mit alloc=(values) für jedes Stratum eine prozentuale Größe angeben kann, siehe hier: http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_surveyselect_sect011.htm

Wenn ich das aber versuche bekomme ich einen Syntaxfehler beim Gleichheitszeichen angezeigt.

Der Code ist:

PROC SURVEYSELECT DATA=datenrein
OUT=datenraus
METHOD=srs
sampsize=1800;

STRATA Variablenname
ALLOC=(0.02 0 0 0 0.13 0.04 0.8 0 0 0.01);

Einfluss verschiedener Parameter auf eine Variable: numerische und kategoriale Daten

Hallo!
Ich möchte den Einfluss verschiedener Parameter auf eine Variable testen (z.B. auf die Artenzahl).
Ich habe numerische Daten für Bodenchemie (geneaugenommen habe ich Ellenberg-Zeigerwerte)und nominale Daten (Landnutzung, Aufnahme-Land), deren Einfluss ich auf z.B. die Artenzahl testen möchte. Gibt es bei den generalisierten linearen Modellen die Möglichkeit, beide Datenformen zu berücksichtigen? Oder muss man getrennte Analysen durchführen? Gibt es andere Verfahren, die mir eine solche Analyse von möglichen Einflüssen erlauben?
Ich würde mich sehr über Hilfe freuen!
Viele Grüße,

LASSO - gibt es ein SAS-Makro für Anwendung von Proportional-Hazard-Regression?

Hallo,

in SAS 9.2 wurde in PROC GLMSELECT als Selektionsmethode LASSO (Tibshirani, R. (1996), "Regression Shrinkage and Selection via the Lasso," Journal of the Royal Statistical Society Series B, 58, 267–288.) implementiert.

Kann mir jemand einen Tipp geben, ob bereits ein SAS-Makro oder ähnliches existiert, dass das LASSO-Verfahren für Ereigniszeiten (speziell Cox'sche Proportional-Hazard-Regression) ermöglicht?

Danke.

Format

Hallo,

ich habe ein Textformat zu einer Variablen über die proc freq definiert.
In den durch die proc freq definierten Gruppen ist eine Gruppe other.

Die proc freq über die Variable mit dem Format funktioniert.
Ich erhalte die Häufigkeit der Gruppe other .

Die proc univariate über die Variable mit dem Format arbeitet nicht
einwandfrei.
Die Gruppe other wird nicht im Gesamten ausgewertet !

Wie erhalte ich eine Gesamt univariate der Gruppe other ?

Freundlichen Gruss
chebello

Substring für numerische Variable

Hallo,

ich benötige aus meinem Datensatz nur die drei ersten Stellen einer numerischen Variable (WGEMNR), um daraus eine neue Variable (POLBEZ) zu machen.
Sehe ich das richtig, dass ich diese zunächst in eine alphanumerische Variable umwandeln muss, um den SUBSTR-Befehl anwenden zu können?
Ich hätte es so gelöst, es läuft zwar und es kommt auch keine Felhermeldung, aber die Spalte mit der neunen Variable POLBEZ ist leer. Woran liegt es?

<
data Radkersburg;
set tabellen_neu;
polbez=substr(put(wgemnr, 9.),1,3);
run;
/>

Danke und LG!

Vorbereitung für logistische Regression!! Hilfe!

Würd mich freuen, wenn Ihr mir helfen könntet.
Warum wird die Prozedur proc format nicht ausgeführt?
Warum steht in der table logistic z.B. nicht 0 sondern <=20 and <=65?!?!

proc format;
value agegroup 0='<=20 and <=65'
1='<20 or >65';
value vision 0='No Problem'
1='Some Problem';
value yes_no 0='No'
1='Yes';
run;

data logistic;
/*Datensatz findet Ihr am Ende des Beitrags*/
infile 'C:Pfad\accident.txt';
input accident age vision drive_ed @@;

if age<20 or age>65 then agegroup=1;
else agegroup=0;
if age<20 then young=1;
else young=0;
if age>65 then old=1;

Fehlende Werte ausgleichen, Missing

Guten Morgen.

Habe eine Frage für die Statistiker und vielleicht GCP Experten.
Nach folgender Formel sollen f-Werte berechnet werden:

f = a*0.5 + b*0.33 + c*(-0.7)

wobei a = MEAN(x1 x2 x3) * 50
b = MEAN(x4 x5 6x x7 x8) * 100
c = MEAN(x9 x10) * 25

So. Wenn x9 und x10 Missing sind, dann ist c auch missing. Dann kann ich auch f nicht mehr vernünftig berechnen. Wie würden Sie mit dem fehlenden c - wert umgehen? Könnte man den irgendwie interpolieren z.B. MEAN(a b) nehmen oder was macht man da?

Mit freundlichen Grüßen

Messwiederholungen auch für kategorelle Daten mit GLM auswerten

Hallo,

ich habe für die Auswertung von Messwiederholungen bei meinen stetigen Variablen ein GLM, das ich in ein Macro umwandeln und dann nach Möglichkeit auch für die kategorielen Variablen nutzen möchte. Hier ein Beispiel:

proc glm data=ueberzeit;
class quart;
model logmar0-logmar3=quart/nouni;
reapeated time;
run;

In den logmar-Variablen stehen die Visusmessungen für den jeweiligen Zeitpunkt.

ARFIMA-Prozess anpassen

Liebe Forum-Community,
ich habe ein ganz einfaches Anliegen, jedoch scheitere ich in der Umsetzung, da ich keine passende Vorlage in der SAS-Hilfedokumentation finde.
Ich möchte einen gegebenen Datensatz (z.B. die Variable RV in der SAS-file work.probe) an einen ARFIMA(1,d,0)-Prozess anpassen. Wie wähle ich in IML die konkrete Variable aus der Datei aus und wie schätze ich dann den ARFIMA darauf (in der SAS-Dokumenation gibt es leider dazu nur irgendwelche Simulationsdaten und ich möchte eine bestehende Zeitreihe anpassen).
Besten Dank für Ihre Hilfe
Dolores

Inhalt abgleichen