Accepted Papers

Research Track

Are We There Yet? Predicting if Executing Applications are Near Completion - - Mohammad Sonji, Mohammed Baydoun, Safaa Diab, Amir Nassereldine, Pedro Bruel, Aditya Dhakal, Rolando Pablo Hong Enriquez, Gourav Rattihalli, Diman Zad Tootaghaj, Gallig Renaud, Barbara Chapman, Fatima K. Abu Salem, Eitan Frachtenberg, Dejan Milojicic, Izzat El Hajj
CarbonShare: Carbon-Fair Allocation for Shared Clusters - - John Thiede, David Irwin, Prashant Shenoy
Variability-Guided Performance Optimization - - Eitan Frachtenberg, Viyom Mittal, Mohammed Baydoun, Aditya Dhakal, Izzat El Hajj, Dejan Milojicic
Kill Smart, Run Fast: Using Job Termination for Efficient and Fair Scheduling in Data Centers - - Rostislav Razumchik, Andrea Marin, Adityo Anggriandy
Improving Energy Efficiency and Performance of Weather and Climate Simulations by Leveraging the Heterogeneity of Modern Systems - - Julius Plehn, Christian von Elm, Pay Giesselmann, Carsten Clauss, Hendryk Bockelmann, Robert Schöne, Jan Frederik Engels
benchkit: A Declarative Framework for Composable Performance Evaluation of System Software - - Antonio Paolillo, Mats Van Molle, Ken Hasselmann
Understanding Foundational Library Energy Consumption - - Jacob D. Hauenstein, Timothy S. Newman
MQGPU: A Multi-Queue Scheduling Framework For GPU Accelerated Serverless Functions - - Alexander Fuerst, Siddharth Anil, Prateek Sharma
ORION: Integrated Runtime Modelling for Predicting Deep Learning Training Time - - Alireza Pourali, Hamzeh Khazaei
LSTC: Large-Scale Triangle Counting on Single GPU - - Kishan Tamboli, Vishwesh Jatala
Benchmarking the Overhead of Distributed Tracing Agents - - David Georg Reichelt, Shinhyung Yang, Marcel Hanson, Wilhelm Hasselbring
SwiftSNNI: Optimized Scheduling for Secure Neural Network Inference (SNNI) on Multi-Core Systems - - Kanwal Batool, Saleem Anwar, Francesco Regazzoni, Andy Pimentel, Zoltán Ádám Mann
A Comparative Evaluation of Imputation Models for Agricultural Weather Networks - - Awanish Khanal, Monowar Hasan
Pulse: A Profiling and Visualization Infrastructure for Heterogeneous Managed Systems - - * Michail Papadimitriou, Maria Xekalaki, Orion Papadakis, Ruiqi Ye, Athanasios Stratikopoulos, Christos Kotselidis*
WASL: Harmonizing Uncoordinated Adaptive Modules in Multi-Tenant Cloud Systems - - Ahsan Pervaiz, Anwesha Das, Vedant Kodagi, Muhammad Husni Santriaji, Henry Hoffmann
MapReplay: Trace-Driven Benchmark Generation for Java HashMap - - Filippo Schiavio, Andrea Rosa, Júnior Löff, Lubomír Bulej, Petr Tuma, Walter Binder
Determining Energy Efficiency Sweet-Spots in production LLM Inference - - Hiari Pizzini Cavagna, Andrea Proia, Giacomo Madella, Giovanni Battista Esposito, Francesco Antici, Daniele Cesarini, Zeynep Kiziltan, Andrea Bartolini
Performance Analysis and Optimization of 3D Generative Diffusion Models across GPU - - Jeeho Ryoo, Yongchan Jung, Muhammad Ali Khaliq, Weidong Zhang, Jiatong Han, Byeong Kil Lee
Holpaca: Holistic and Adaptable Cache Management for Shared Environments - - José Pedro Peixoto, Alexis Gonzales, Janki Bhimani, Raju Rangaswami, Cláudia Brito, João Paulo, Ricardo Macedo
B-Perf: Black-box Performance Antipattern Detection Using System-level Execution Tracing - - Morteza Noferesti, Mahsa Panahanddeh, Naser Ezzati-Jivan
Energy-Efficient Right-Sizing of Kafka-like Message Brokers for IoT Workloads - - Govind KP, Romain Rouvoy, Guillaume Pierre
Energy-efficient dynamic partitioning and tensors compression of AI applications in Smart Eyewears - - Abednego Wamuhindo Kambale, Samin Shokrivahed, Giacomo Verticale, Francesca Palermo, Diana Trojaniello, Danilo Ardagna
An Evaluation Study of Generative AI Systems: Framework-Aware Performance Under Real-World Constraints - - Abed Matinpour, Farhoud Jafari Kaleibar, Sara Fehresti, Shaylin Ziaei, Marin Litoiu
Cross-Platform, Cross-Framework Development of Hybrid-Parallel Matrix-Multiplication codes - (Short paper) - Vyuhita Bonthu, Nikhil Hegde
Performance and Cost Implications of Migrating Serverless Functions from x86 to ARM based Servers - (Short paper) - Yassine Lazreg, Saman Akbari, Manfred Hauswirth
To Offload or Not To Offload: Model-driven Comparison of Edge-native and On-device Processing In the Era of Accelerators - (Short paper) - Nathan Ng, David Irwin, Ananthram Swami, Don Towsley, Prashant Shenoy
Modeling Extreme End-to-End Delays for Availability Assessment on Latency Datasets - (Short paper) - Orangel Azuaje Contreras, Ana Aguiar
FLYT: Transparent and Elastic GPU Provisioning for Multi-Tenant Cloud Services - (Short paper) - Santhosh Kumar M, Sameer Ahmad, Armaan Chowfin, Purushottam Kulkarni, Anand Eswaran, Praveen Jayachandran

Industrial Track

Evaluating Kubernetes Performance for GenAI Inference: From Automatic Speech Recognition to LLM Summarization - Sai Sindhur Malleni, Raúl Sevilla, Aleksei Vasilevskii, José Castillo Lema, André Bauer
A Transparent and Efficient Performance Analysis Approach to Enhance DPDK Observability - Adel Belkhiri, Arnaud Fiorini, Matthew Khouzam, Heng Li
G1HeapVis: Visualizing and Measuring Heap Fragmentation - Oleksandr Kachur
KLUE: A Framework for Cost-Effective Experimentation in Emulated Kubernetes Clusters - Kayky Fidelis, Geraldo Junior, Caetano Albuquerque, Giovanni Farias, Thiago Emmanuel Pereira, Fabio Morais, Kilian Melcher
On the Efficiency and Disruption Trade-Offs of Kubernetes Packing Heuristics - Mariane Santos Zeitouni, Oscar Brito, Matheus Rocha, Thiago Emmanuel Pereira, Gabriel Gomes
The Impact of Memory Configuration on Server Efficiency - Maximilian Meissner, Khang Pham, Aaron Cragin, Klaus-Dieter Lange, Samuel Kounev
Low-Latency ML Offloading Across Edge and IoT Devices - Konstantinos Papazafeiropoulos, Anastasia Mallikopoulou, Anastassios Nanos, Georgios Goumas, Nectarios Koziris

Journal First Track

Trust Your Local Scaler: A Continuous, Decentralized Approach to Autoscaling - Martin Straesser, Stefan Geissler, Stanislav Lange, Lukas Kilian Schumann, Tobias Hossfeld , Samuel Kounev