Στο πλαίσιο του Π.Μ.Σ. «Στατιστική και Αναλογιστικά - Χρηματοοικονομικά Μαθηματικά», και των εργαστηρίων «Στατιστικής και Ανάλυσης Δεδομένων» και «Αναλογιστικών και Χρηματοοικονομικών Μαθηματικών», οργανώνεται σεμιναριακή διάλεξη η οποία θα πραγματοποιηθεί από τον Dr. Yiannis Kamarianakis, Research Director, Data Science Group, Institute of Applied and Computational Mathematics, FORTH, με τίτλο:
"Risk prediction models with high dimensional data: adaptive shrinkage with subagging"
Η σεμιναριακή διάλεξη θα πραγματοποιηθεί την Τρίτη 3 Μαρτίου και ώρα 19:00 και είναι ανοικτή σε οποιονδήποτε ενδιαφερόμενο.
💻 Σένδεσμος Διαδικτυακής Αίθουσας:
https://aegean-gr.zoom.us/j/97072796812?pwd=7tJZHGMSw4Ga92imW9bwknVDWGFYoQ.1
Meeting ID: 970 7279 6812
Passcode: 392102
Παραθέτουμε το abstract της σεμιναριακής διάλεξης:
This lecture discusses simultaneous parameter estimation and variable selection within the framework of logistic regression.
Motivated by a challenging application, namely the development of a screening tool for dyslexia based on eye-tracking, we first focus on predicting low-dimensional binary outcomes when the number of events is small compared with the number of regression coefficients. Under these circumstances, overfitting and reduced predictive accuracy may be severe. We introduce subsampling-based adaptive ridge (SARIDGE), a novel two-stage penalization framework in which subsampling is used to identify a set of relevant variables, which is then carried forward for estimation, with adaptive penalties defined by the magnitudes of the first-stage estimates. An extensive simulation study shows that SARIDGE delivers consistent gains in risk prediction and coefficient estimation accuracy compared with numerous penalized and stepwise estimators across a variety of settings. In the motivating application, the proposed methodology outperforms Random Forests and Support Vector Machines in terms of interpretability while also achieving superior predictive accuracy.