Matei Zaharia

researcher

co-founder at Databricks

USA

Data / AI Infra. co-founder at Databricks.

@matei_zaharia OpenAlex

50 papers found

Unity Catalog: Open and Universal Governance for the Lakehouse and Beyond

20252 citations

DOI OpenAlex

MoE-L <scp>ightning</scp> : High-Throughput MoE Inference on Memory-constrained GPUs

20252 citations

DOI OpenAlex

Databricks Lakeguard: Supporting Fine-grained Access Control and Multi-user Capabilities for Apache Spark Workloads

20252 citations

DOI OpenAlex

Identification of cardiac wall motion abnormalities in diverse populations by deep learning of the electrocardiogram

npj Digital Medicine20255 citations

DOI OpenAlex

WARP: An Efficient Engine for Multi-Vector Retrieval

20251 citations

DOI OpenAlex

vAttention: Verified Sparse Attention

arXiv (Cornell University)2025

DOI arXiv OpenAlex

ColBERT-Serve: Efficient Multi-stage Memory-Mapped Scoring

Lecture notes in computer science20251 citations

DOI OpenAlex

Semantic Operators and Their Optimization: Enabling LLM-Based Data Processing with Accuracy Guarantees in LOTUS

Proceedings of the VLDB Endowment20251 citations

DOI OpenAlex

The Cambridge Report on Database Research

arXiv (Cornell University)20251 citations

DOI arXiv OpenAlex

Language Models Can Easily Learn to Reason from Demonstrations

20252 citations

DOI OpenAlex

Are More LLM Calls All You Need? Towards the Scaling Properties of Compound AI Systems

20241 citations

DOI OpenAlex

Are More LLM Calls All You Need? Towards Scaling Laws of Compound Inference Systems

arXiv (Cornell University)20245 citations

DOI arXiv OpenAlex

RAFT: Adapting Language Model to Domain Specific RAG

arXiv (Cornell University)202426 citations

DOI arXiv OpenAlex

Long Context RAG Performance of Large Language Models

arXiv (Cornell University)20245 citations

DOI arXiv OpenAlex

Adaptive and Robust Query Execution for Lakehouses at Scale

Proceedings of the VLDB Endowment20249 citations

DOI OpenAlex

Optimizing Instructions and Demonstrations for Multi-Stage Language Model Programs

arXiv (Cornell University)20243 citations

DOI arXiv OpenAlex

Semantic Operators: A Declarative Model for Rich, AI-based Data Processing

arXiv (Cornell University)20249 citations

DOI arXiv OpenAlex

Everything Everywhere All At Once: Efficient Cross-Service Program Analysis with OverSeer

20241 citations

DOI OpenAlex

Exploiting Programmatic Behavior of LLMs: Dual-Use Through Standard Security Attacks

202464 citations

DOI OpenAlex

Optimizing Instructions and Demonstrations for Multi-Stage Language Model Programs

202414 citations

DOI OpenAlex

ARES: An Automated Evaluation Framework for Retrieval-Augmented Generation Systems

202462 citations

DOI OpenAlex

Optimizing LLM Queries in Relational Data Analytics Workloads

arXiv (Cornell University)20246 citations

DOI arXiv OpenAlex

Image and data mining in reticular chemistry powered by GPT-4V

Digital Discovery202450 citations

DOI OpenAlex

How Is ChatGPT’s Behavior Changing Over Time?

Harvard Data Science Review2024245 citations

DOI OpenAlex

ACORN: Performant and Predicate-Agnostic Search Over Vector Embeddings and Structured Data

arXiv (Cornell University)20243 citations

DOI arXiv OpenAlex

Text2SQL is Not Enough: Unifying AI and Databases with TAG

arXiv (Cornell University)20243 citations

DOI arXiv OpenAlex

World Model on Million-Length Video And Language With Blockwise RingAttention

arXiv (Cornell University)202411 citations

DOI arXiv OpenAlex

Specifications: The missing link to making the development of LLM systems an engineering discipline

arXiv (Cornell University)20242 citations

DOI arXiv OpenAlex

Data Management for ML-Based Analytics and Beyond

ACM / IMS Journal of Data Science20243 citations

DOI OpenAlex

ALTO

20243 citations

DOI OpenAlex

Drowning in Documents: Consequences of Scaling Reranker Inference

arXiv (Cornell University)2024

DOI arXiv OpenAlex

MoE-Lightning: High-Throughput MoE Inference on Memory-constrained GPUs

arXiv (Cornell University)20241 citations

DOI arXiv OpenAlex

ACORN: Performant and Predicate-Agnostic Search Over Vector Embeddings and Structured Data

Proceedings of the ACM on Management of Data202428 citations

DOI OpenAlex

Novel Domain Knowledge-Encoding Algorithm Enables Label-Efficient Deep Learning for Cardiac CT Segmentation to Guide Atrial Fibrillation Treatment in a Pilot Dataset

Diagnostics20242 citations

DOI OpenAlex

Epoxy: ACID Transactions across Diverse Data Stores

Proceedings of the VLDB Endowment202315 citations

DOI OpenAlex

Accelerating Aggregation Queries on Unstructured Streams of Data

Proceedings of the VLDB Endowment20235 citations

DOI OpenAlex

ARES: An Automated Evaluation Framework for Retrieval-Augmented Generation Systems

arXiv (Cornell University)20234 citations

DOI arXiv OpenAlex

Exploration with Principles for Diverse AI Supervision

arXiv (Cornell University)2023

DOI arXiv OpenAlex

FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance

arXiv (Cornell University)202349 citations

DOI arXiv OpenAlex

Congestion Control Safety via Comparative Statics

20231 citations

DOI OpenAlex

Abstract 17420: Enhanced Identification of Cardiac Wall Motion Abnormalities: An Externally Validated Deep Neural Network Approach Outperforms Expert and Quantitative Analysis of Electrocardiograms

Circulation20231 citations

DOI OpenAlex

Data Acquisition: A New Frontier in Data-centric AI

arXiv (Cornell University)20233 citations

DOI arXiv OpenAlex

Cornflakes: Zero-Copy Serialization for Microsecond-Scale Networking

202317 citations

DOI OpenAlex

Zelda: Video Analytics using Vision-Language Models

arXiv (Cornell University)20234 citations

DOI arXiv OpenAlex

How is ChatGPT's behavior changing over time?

arXiv (Cornell University)2023162 citations

DOI arXiv OpenAlex

HAPI Explorer: Comprehension, Discovery, and Explanation on History of ML APIs

Proceedings of the AAAI Conference on Artificial Intelligence20231 citations

DOI OpenAlex

Ring Attention with Blockwise Transformers for Near-Infinite Context

arXiv (Cornell University)202311 citations

DOI arXiv OpenAlex

DSPy: Compiling Declarative Language Model Calls into Self-Improving Pipelines

arXiv (Cornell University)202346 citations

DOI arXiv OpenAlex

DSPy Assertions: Computational Constraints for Self-Refining Language Model Pipelines

arXiv (Cornell University)20232 citations

DOI arXiv OpenAlex

R <sup>3</sup> : Record-Replay-Retroaction for Database-Backed Applications

Proceedings of the VLDB Endowment20238 citations

DOI OpenAlex