Kotlin · CarloMariaProietti · Nov 25, 2025 · Nov 28, 2025 · Dec 9, 2025 · Dec 10, 2025
diff --git a/core/src/main/kotlin/org/jetbrains/kotlinx/dataframe/api/max.kt b/core/src/main/kotlin/org/jetbrains/kotlinx/dataframe/api/max.kt
@@ -19,6 +19,7 @@ import org.jetbrains.kotlinx.dataframe.impl.aggregation.modes.aggregateByOrNull
 import org.jetbrains.kotlinx.dataframe.impl.aggregation.modes.aggregateFor
 import org.jetbrains.kotlinx.dataframe.impl.aggregation.modes.aggregateOf
 import org.jetbrains.kotlinx.dataframe.impl.aggregation.modes.aggregateOfRow
+import org.jetbrains.kotlinx.dataframe.impl.columns.ValueColumnInternal
 import org.jetbrains.kotlinx.dataframe.impl.columns.toComparableColumns
 import org.jetbrains.kotlinx.dataframe.impl.suggestIfNull
 import org.jetbrains.kotlinx.dataframe.util.DEPRECATED_ACCESS_API
@@ -33,7 +34,11 @@ public fun <T : Comparable<T>> DataColumn<T?>.max(skipNaN: Boolean = skipNaNDefa
     maxOrNull(skipNaN).suggestIfNull("max")
 
 public fun <T : Comparable<T>> DataColumn<T?>.maxOrNull(skipNaN: Boolean = skipNaNDefault): T? =
-    Aggregators.max<T>(skipNaN).aggregateSingleColumn(this)
+    if (this is ValueColumnInternal<*>) {
+        Aggregators.max<T>(skipNaN).aggregateSingleColumn(this, this.max, skipNaN)
+    } else {
+        Aggregators.max<T>(skipNaN).aggregateSingleColumn(this)
+    }
 
 public inline fun <T, reified R : Comparable<R & Any>?> DataColumn<T>.maxBy(
     skipNaN: Boolean = skipNaNDefault,

diff --git a/.../jetbrains/kotlinx/dataframe/impl/aggregation/aggregators/AggregatorAggregationHandler.kt b/.../jetbrains/kotlinx/dataframe/impl/aggregation/aggregators/AggregatorAggregationHandler.kt
@@ -3,6 +3,7 @@ package org.jetbrains.kotlinx.dataframe.impl.aggregation.aggregators
 import org.jetbrains.kotlinx.dataframe.DataColumn
 import org.jetbrains.kotlinx.dataframe.api.asSequence
 import org.jetbrains.kotlinx.dataframe.impl.aggregation.aggregators.aggregationHandlers.SelectingAggregationHandler
+import org.jetbrains.kotlinx.dataframe.impl.columns.WrappedStatistic
 import kotlin.reflect.KType
 
 /**
@@ -34,6 +35,42 @@ public interface AggregatorAggregationHandler<in Value : Any, out Return : Any?>
             valueType = column.type().toValueType(),
         )
 
+    /**
+     * optimized override of [aggregateSingleColumn],
+     * preferred when column's runtime type is ValueColumnInternal so that
+     * it is possible to exploit cached statistics which are proper of ValueColumnInternal
+     */
+    public fun aggregateSingleColumn(
+        column: DataColumn<Value?>,
+        wrappedStatistic: WrappedStatistic,
+        skipNaN: Boolean,
+    ): Return {
+        when {
+            skipNaN && wrappedStatistic.wasComputedSkippingNaN -> {
+                return wrappedStatistic.statisticComputedSkippingNaN as Return
+            }
+
+            (!skipNaN) && wrappedStatistic.wasComputedNotSkippingNaN -> {
+                return wrappedStatistic.statisticComputedNotSkippingNaN as Return
+            }
+
+            else -> {
+                val statistic = aggregateSequence(
+                    values = column.asSequence(),
+                    valueType = column.type().toValueType(),
+                )
+                if (skipNaN) {
+                    wrappedStatistic.wasComputedSkippingNaN = true
+                    wrappedStatistic.statisticComputedSkippingNaN = statistic
+                } else {
+                    wrappedStatistic.wasComputedNotSkippingNaN = true
+                    wrappedStatistic.statisticComputedNotSkippingNaN = statistic
+                }
+                return aggregateSingleColumn(column, wrappedStatistic, skipNaN)
+            }
+        }
+    }
+
     /**
      * Function that can give the return type of [aggregateSequence] as [KType], given the type of the input.
      * This allows aggregators to avoid runtime type calculations.

diff --git a/core/src/main/kotlin/org/jetbrains/kotlinx/dataframe/impl/columns/ValueColumnImpl.kt b/core/src/main/kotlin/org/jetbrains/kotlinx/dataframe/impl/columns/ValueColumnImpl.kt
@@ -8,14 +8,26 @@ import org.jetbrains.kotlinx.dataframe.columns.ValueColumn
 import kotlin.reflect.KType
 import kotlin.reflect.full.withNullability
 
+public class WrappedStatistic(
+    public var wasComputedSkippingNaN: Boolean = false,
+    public var wasComputedNotSkippingNaN: Boolean = false,
+    public var statisticComputedSkippingNaN: Any? = null,
+    public var statisticComputedNotSkippingNaN: Any? = null,
+)
+
+internal interface ValueColumnInternal<T> : ValueColumn<T> {
+    val max: WrappedStatistic
+}
+
 internal open class ValueColumnImpl<T>(
     values: List<T>,
     name: String,
     type: KType,
     val defaultValue: T? = null,
     distinct: Lazy<Set<T>>? = null,
 ) : DataColumnImpl<T>(values, name, type, distinct),
-    ValueColumn<T> {
+    ValueColumn<T>,
+    ValueColumnInternal<T> {
 
     override fun distinct() = ValueColumnImpl(toSet().toList(), name, type, defaultValue, distinct)
 
@@ -48,10 +60,13 @@ internal open class ValueColumnImpl<T>(
     override fun defaultValue() = defaultValue
 
     override fun forceResolve() = ResolvingValueColumn(this)
+
+    override val max = WrappedStatistic()
 }
 
 internal class ResolvingValueColumn<T>(override val source: ValueColumn<T>) :
     ValueColumn<T> by source,
+    ValueColumnInternal<T>,
     ForceResolvedColumn<T> {
 
     override fun resolve(context: ColumnResolutionContext) = super<ValueColumn>.resolve(context)
@@ -70,4 +85,6 @@ internal class ResolvingValueColumn<T>(override val source: ValueColumn<T>) :
     override fun equals(other: Any?) = source.checkEquals(other)
 
     override fun hashCode(): Int = source.hashCode()
+
+    override val max = WrappedStatistic()
 }
diff --git a/git b/git