Merge pull request #7131 from onflow/leo/util-read-storage-stats

zhangchiqing · web-flow · commit 092026b24887 · 2025-03-12T16:00:03.000Z
[Util] Read storage stats
diff --git a/cmd/util/cmd/read-badger/cmd/stats.go b/cmd/util/cmd/read-badger/cmd/stats.go
@@ -0,0 +1,58 @@
+package cmd
+
+import (
+	"fmt"
+	"runtime"
+
+	"github.com/rs/zerolog/log"
+	"github.com/spf13/cobra"
+
+	"github.com/onflow/flow-go/cmd/util/cmd/common"
+	"github.com/onflow/flow-go/storage"
+	"github.com/onflow/flow-go/storage/operation"
+	"github.com/onflow/flow-go/storage/operation/badgerimpl"
+	"github.com/onflow/flow-go/storage/operation/pebbleimpl"
+	"github.com/onflow/flow-go/storage/pebble"
+)
+
+var flagDBType string
+
+func init() {
+	rootCmd.AddCommand(statsCmd)
+	statsCmd.Flags().StringVar(&flagDBType, "dbtype", "badger", "database type to use (badger or pebble)")
+}
+
+var statsCmd = &cobra.Command{
+	Use:   "stats",
+	Short: "get stats for the database, such as key count, total value size, min/max value size etc",
+	RunE: func(cmd *cobra.Command, args []string) error {
+		var sdb storage.DB
+		if flagDBType == "badger" {
+			db := common.InitStorage(flagDatadir)
+			defer db.Close()
+			sdb = badgerimpl.ToDB(db)
+		} else if flagDBType == "pebble" {
+			pdb, err := pebble.MustOpenDefaultPebbleDB(log.Logger, flagPebbleDir)
+			if err != nil {
+				return fmt.Errorf("failed to open pebble db: %w", err)
+			}
+			defer pdb.Close()
+			sdb = pebbleimpl.ToDB(pdb)
+		} else {
+			return fmt.Errorf("invalid db type")
+		}
+
+		numWorkers := runtime.NumCPU()
+		if numWorkers > 256 {
+			numWorkers = 256
+		}
+		log.Info().Msgf("getting stats for %s db at %s with %v workers0", flagDBType, flagDatadir, numWorkers)
+		stats, err := operation.SummarizeKeysByFirstByteConcurrent(log.Logger, sdb.Reader(), numWorkers)
+		if err != nil {
+			return fmt.Errorf("failed to get stats: %w", err)
+		}
+
+		operation.PrintStats(log.Logger, stats)
+		return nil
+	},
+}
diff --git a/storage/operation/stats.go b/storage/operation/stats.go
@@ -0,0 +1,202 @@
+package operation
+
+import (
+	"context"
+	"encoding/json"
+	"fmt"
+	"math"
+	"sort"
+	"sync"
+
+	"github.com/rs/zerolog"
+
+	"github.com/onflow/flow-go/module/util"
+	"github.com/onflow/flow-go/storage"
+)
+
+// Stats holds statistics for a single prefix group.
+type Stats struct {
+	Count       int     `json:"count"`
+	MinSize     int     `json:"min_size"`
+	MaxSize     int     `json:"max_size"`
+	TotalSize   int     `json:"total_size"`
+	AverageSize float64 `json:"avg_size"`
+}
+
+// SummarizeKeysByFirstByteConcurrent iterates over all prefixes [0x00..0xFF] in parallel
+// using nWorker goroutines. Each worker handles one prefix at a time until all are processed.
+//
+// The storage.Reader must be able to create multiple iterators concurrently.
+func SummarizeKeysByFirstByteConcurrent(log zerolog.Logger, r storage.Reader, nWorker int) (map[byte]Stats, error) {
+	// We'll have at most 256 possible prefixes (0x00..0xFF).
+	// Create tasks (one per prefix), a results channel, and a wait group.
+	taskChan := make(chan byte, 256)
+	resultChan := make(chan struct {
+		prefix byte
+		stats  Stats
+		err    error
+	}, 256)
+
+	var wg sync.WaitGroup
+	ctx, cancel := context.WithCancel(context.Background())
+	defer cancel()
+
+	// Start nWorker goroutines.
+	for i := 0; i < nWorker; i++ {
+		wg.Add(1)
+		go func() {
+			defer wg.Done()
+			for {
+				select {
+				case <-ctx.Done():
+					return // Stop immediately on cancellation
+				case prefix, ok := <-taskChan:
+					if !ok {
+						return // Stop if taskChan is closed
+					}
+
+					st, err := processPrefix(r, prefix)
+					resultChan <- struct {
+						prefix byte
+						stats  Stats
+						err    error
+					}{
+						prefix: prefix,
+						stats:  st,
+						err:    err,
+					}
+				}
+			}
+		}()
+	}
+
+	progress := util.LogProgress(log,
+		util.DefaultLogProgressConfig(
+			"Summarizing keys by first byte",
+			256,
+		))
+
+	// Send all prefixes [0..255] to taskChan.
+	for p := 0; p < 256; p++ {
+		taskChan <- byte(p)
+	}
+	close(taskChan)
+
+	// Once all workers finish, close the result channel.
+	go func() {
+		wg.Wait()
+		close(resultChan)
+	}()
+
+	// Gather results. We'll accumulate them in a map[prefix]Stats.
+	finalStats := make(map[byte]Stats, 256)
+
+	var err error
+	// If we encounter an error, we will return it immediately.
+	for res := range resultChan {
+		if res.err != nil {
+			cancel() // Cancel running goroutines
+			err = res.err
+			break
+		}
+		finalStats[res.prefix] = res.stats
+		log.Info().
+			Int("prefix", int(res.prefix)).
+			Int("total", res.stats.TotalSize).
+			Int("count", res.stats.Count).
+			Int("min", res.stats.MinSize).
+			Int("max", res.stats.MaxSize).
+			Msg("Processed prefix")
+		progress(1) // log the progress
+	}
+
+	if err != nil {
+		return nil, err
+	}
+	return finalStats, nil
+}
+
+// processPrefix does the actual iteration and statistic calculation for a single prefix.
+// It returns the Stats for that prefix, or an error if iteration fails.
+func processPrefix(r storage.Reader, prefix byte) (Stats, error) {
+	var s Stats
+	// We use MinSize = math.MaxInt as a sentinel so the first real size will become the new minimum.
+	s.MinSize = math.MaxInt
+
+	// Iterator range is [prefix, prefix] (inclusive).
+	start, end := []byte{prefix}, []byte{prefix}
+	it, err := r.NewIter(start, end, storage.IteratorOption{BadgerIterateKeyOnly: true})
+	if err != nil {
+		return s, fmt.Errorf("failed to create iterator for prefix 0x%X: %w", prefix, err)
+	}
+	defer it.Close()
+
+	for it.First(); it.Valid(); it.Next() {
+		item := it.IterItem()
+
+		// item.Value(...) is a function call that gives us the value, on which we measure size.
+		err := item.Value(func(val []byte) error {
+			size := len(val)
+			s.Count++
+			s.TotalSize += size
+			if size < s.MinSize {
+				s.MinSize = size
+			}
+			if size > s.MaxSize {
+				s.MaxSize = size
+			}
+			return nil
+		})
+
+		if err != nil {
+			return s, fmt.Errorf("failed to process value for prefix %v: %w", int(prefix), err)
+		}
+	}
+
+	// If we found no keys for this prefix, reset MinSize to 0 to avoid confusion.
+	if s.Count == 0 {
+		s.MinSize = 0
+	} else {
+		// Compute average size.
+		s.AverageSize = float64(s.TotalSize) / float64(s.Count)
+	}
+
+	return s, nil
+}
+
+// PrintStats logs the statistics for each prefix in ascending order.
+// Each prefix is shown in hex, along with count, min, max, total, and average sizes.
+func PrintStats(log zerolog.Logger, stats map[byte]Stats) {
+	if len(stats) == 0 {
+		log.Info().Msg("No stats to print (map is empty).")
+		return
+	}
+
+	// Convert map to a slice of key-value pairs
+	statList := make([]struct {
+		Prefix int   `json:"prefix"`
+		Stats  Stats `json:"stats"`
+	}, 0, len(stats))
+
+	for p, s := range stats {
+		statList = append(statList, struct {
+			Prefix int   `json:"prefix"`
+			Stats  Stats `json:"stats"`
+		}{Prefix: int(p), Stats: s})
+	}
+
+	// Sort by TotalSize in ascending order
+	sort.Slice(statList, func(i, j int) bool {
+		return statList[i].Stats.TotalSize < statList[j].Stats.TotalSize
+	})
+
+	// Convert sorted stats to JSON
+	jsonData, err := json.MarshalIndent(statList, "", "  ")
+	if err != nil {
+		log.Error().Err(err).Msg("Failed to marshal stats to JSON")
+		return
+	}
+
+	// Log the JSON
+	log.Info().RawJSON("stats", jsonData).Msg("Sorted prefix stats")
+}
diff --git a/storage/operation/stats_test.go b/storage/operation/stats_test.go
@@ -0,0 +1,75 @@
+package operation_test
+
+import (
+	"testing"
+
+	"github.com/stretchr/testify/require"
+
+	"github.com/onflow/flow-go/storage"
+	"github.com/onflow/flow-go/storage/operation"
+	"github.com/onflow/flow-go/storage/operation/dbtest"
+	"github.com/onflow/flow-go/utils/unittest"
+)
+
+func TestSummarizeKeysByFirstByteConcurrent(t *testing.T) {
+	dbtest.RunWithDB(t, func(t *testing.T, db storage.DB) {
+
+		err := db.WithReaderBatchWriter(func(rw storage.ReaderBatchWriter) error {
+			// insert random events
+			b := unittest.IdentifierFixture()
+			events := unittest.EventsFixture(30)
+			for _, evt := range events {
+				err := operation.InsertEvent(rw.Writer(), b, evt)
+				if err != nil {
+					return err
+				}
+			}
+
+			// insert 100 chunk data packs
+			for i := 0; i < 100; i++ {
+				collectionID := unittest.IdentifierFixture()
+				cdp := &storage.StoredChunkDataPack{
+					ChunkID:      unittest.IdentifierFixture(),
+					StartState:   unittest.StateCommitmentFixture(),
+					Proof:        []byte{'p'},
+					CollectionID: collectionID,
+				}
+				err := operation.InsertChunkDataPack(rw.Writer(), cdp)
+				if err != nil {
+					return err
+				}
+			}
+
+			// insert 20 results
+			for i := 0; i < 20; i++ {
+				result := unittest.ExecutionResultFixture()
+				err := operation.InsertExecutionResult(rw.Writer(), result)
+				if err != nil {
+					return err
+				}
+			}
+
+			return nil
+		})
+		require.NoError(t, err)
+
+		// summarize keys by first byte
+		stats, err := operation.SummarizeKeysByFirstByteConcurrent(unittest.Logger(), db.Reader(), 10)
+		require.NoError(t, err)
+
+		// print
+		operation.PrintStats(unittest.Logger(), stats)
+
+		for i := 0; i < 256; i++ {
+			count := 0
+			if i == 102 { // events
+				count = 30
+			} else if i == 100 { // CDP
+				count = 100
+			} else if i == 36 { // results
+				count = 20
+			}
+			require.Equal(t, count, stats[byte(i)].Count, "byte %d", i)
+		}
+	})
+}