From 152b9a7acddfd97d088e062b502d7aa19e91892f Mon Sep 17 00:00:00 2001
From: Ali Sao <asao1@uci.edu>
Date: Thu, 12 Mar 2026 10:20:44 -0700
Subject: [PATCH 1/2] Refactor little endian binary decoding into a shared
 internal utility module and update Parquet and Lazy binary readers to use the
 same implementation so byte decoding behavior is   consistent across code
 paths and easier to maintain; this removes duplicated decode logic, keeps
 existing APIs intact through Parquet.Binary wrappers, adds and preserves
 endian   regression coverage, and confirms compatibility by running
 formatting, lint, full build, and the complete test suite successfully.

---
 dataframe.cabal                    |   2 +
 src/DataFrame/IO/Parquet.hs        |  13 ++--
 src/DataFrame/IO/Parquet/Binary.hs |  39 +++--------
 src/DataFrame/Internal/Binary.hs   | 105 +++++++++++++++++++++++++++++
 src/DataFrame/Lazy/IO/Binary.hs    |  36 ++--------
 tests/Parquet.hs                   |  74 ++++++++++++++++++++
 6 files changed, 200 insertions(+), 69 deletions(-)
 create mode 100644 src/DataFrame/Internal/Binary.hs

diff --git a/dataframe.cabal b/dataframe.cabal
index 4a984cd..88c6e89 100644
--- a/dataframe.cabal
+++ b/dataframe.cabal
@@ -55,6 +55,7 @@ library
                     DataFrame.Internal.Interpreter,
                     DataFrame.Internal.Parsing,
                     DataFrame.Internal.Column,
+                    DataFrame.Internal.Binary,
                     DataFrame.Internal.Statistics,
                     DataFrame.Display.Terminal.PrettyPrint,
                     DataFrame.Display.Terminal.Colours,
@@ -246,6 +247,7 @@ test-suite tests
     build-depends:  base >= 4 && < 5,
                     bytestring >= 0.11 && < 0.13,
                     dataframe >= 0.5 && < 1,
+                    bytestring >= 0.11 && < 0.13,
                     directory >= 1.3.0.0 && < 2,
                     HUnit ^>= 1.6,
                     QuickCheck >= 2 && < 3,
diff --git a/src/DataFrame/IO/Parquet.hs b/src/DataFrame/IO/Parquet.hs
index 243c3c3..9a47fef 100644
--- a/src/DataFrame/IO/Parquet.hs
+++ b/src/DataFrame/IO/Parquet.hs
@@ -8,7 +8,6 @@ module DataFrame.IO.Parquet where
 
 import Control.Exception (throw)
 import Control.Monad
-import Data.Bits
 import qualified Data.ByteString as BSO
 import Data.Either
 import Data.IORef
@@ -20,8 +19,8 @@ import qualified Data.Text as T
 import Data.Text.Encoding
 import Data.Time
 import Data.Time.Clock.POSIX (posixSecondsToUTCTime)
-import Data.Word
 import DataFrame.Errors (DataFrameException (ColumnNotFoundException))
+import DataFrame.Internal.Binary (littleEndianWord32)
 import qualified DataFrame.Internal.Column as DI
 import DataFrame.Internal.DataFrame (DataFrame)
 import DataFrame.Internal.Expression (Expr, getColumns)
@@ -334,13 +333,9 @@ readMetadataSizeFromFooter :: BSO.ByteString -> (Int, BSO.ByteString)
 readMetadataSizeFromFooter contents =
     let
         footerOffSet = BSO.length contents - 8
-        sizeBytes =
-            map
-                (fromIntegral @Word8 @Int32 . BSO.index contents)
-                [footerOffSet .. footerOffSet + 3]
-        size = fromIntegral $ L.foldl' (.|.) 0 $ zipWith shift sizeBytes [0, 8, 16, 24]
-        magicStringBytes = map (BSO.index contents) [footerOffSet + 4 .. footerOffSet + 7]
-        magicString = BSO.pack magicStringBytes
+        footer = BSO.drop footerOffSet contents
+        size = fromIntegral (littleEndianWord32 footer)
+        magicString = BSO.take 4 (BSO.drop 4 footer)
      in
         (size, magicString)
 
diff --git a/src/DataFrame/IO/Parquet/Binary.hs b/src/DataFrame/IO/Parquet/Binary.hs
index 3fc85bc..1f2bb62 100644
--- a/src/DataFrame/IO/Parquet/Binary.hs
+++ b/src/DataFrame/IO/Parquet/Binary.hs
@@ -11,47 +11,30 @@ import Data.Char
 import Data.IORef
 import Data.Int
 import Data.Word
+import qualified DataFrame.Internal.Binary as Binary
 import qualified Foreign.Marshal.Alloc as Foreign
 import qualified Foreign.Ptr as Foreign
 import qualified Foreign.Storable as Foreign
 
 littleEndianWord32 :: BS.ByteString -> Word32
-littleEndianWord32 bytes
-    | BS.length bytes >= 4 =
-        foldr
-            (.|.)
-            0
-            ( zipWith
-                (\b i -> fromIntegral b `shiftL` i)
-                (BS.unpack $ BS.take 4 bytes)
-                [0, 8, 16, 24]
-            )
-    | otherwise =
-        littleEndianWord32 (BS.take 4 $ bytes `BS.append` BS.pack [0, 0, 0, 0])
+littleEndianWord32 = Binary.littleEndianWord32
+{-# INLINE littleEndianWord32 #-}
 
 littleEndianWord64 :: BS.ByteString -> Word64
-littleEndianWord64 bytes =
-    foldr
-        (.|.)
-        0
-        ( zipWith
-            (\b i -> fromIntegral b `shiftL` i)
-            (BS.unpack $ BS.take 8 bytes)
-            [0, 8 ..]
-        )
+littleEndianWord64 = Binary.littleEndianWord64
+{-# INLINE littleEndianWord64 #-}
 
 littleEndianInt32 :: BS.ByteString -> Int32
-littleEndianInt32 = fromIntegral . littleEndianWord32
+littleEndianInt32 = Binary.littleEndianInt32
+{-# INLINE littleEndianInt32 #-}
 
 word64ToLittleEndian :: Word64 -> BS.ByteString
-word64ToLittleEndian w =
-    BS.map
-        (\i -> fromIntegral (w `shiftR` fromIntegral i))
-        (BS.pack [0, 8, 16, 24, 32, 40, 48, 56])
+word64ToLittleEndian = Binary.word64ToLittleEndian
+{-# INLINE word64ToLittleEndian #-}
 
 word32ToLittleEndian :: Word32 -> BS.ByteString
-word32ToLittleEndian w =
-    BS.map (\i -> fromIntegral (w `shiftR` fromIntegral i)) (BS.pack [0, 8, 16, 24])
+word32ToLittleEndian = Binary.word32ToLittleEndian
+{-# INLINE word32ToLittleEndian #-}
 
 readUVarInt :: BS.ByteString -> (Word64, BS.ByteString)
 readUVarInt xs = loop xs 0 0 0
diff --git a/src/DataFrame/Internal/Binary.hs b/src/DataFrame/Internal/Binary.hs
new file mode 100644
index 0000000..53a9f99
--- /dev/null
+++ b/src/DataFrame/Internal/Binary.hs
@@ -0,0 +1,105 @@
+module DataFrame.Internal.Binary where
+
+import Data.Bits
+import qualified Data.ByteString as BS
+import Data.Int
+import Data.Word
+
+littleEndianWord32 :: BS.ByteString -> Word32
+littleEndianWord32 bytes
+    | len >= 4 =
+        assembleWord32
+            (BS.index bytes 0)
+            (BS.index bytes 1)
+            (BS.index bytes 2)
+            (BS.index bytes 3)
+    | otherwise =
+        assembleWord32
+            (byteAtOrZero len bytes 0)
+            (byteAtOrZero len bytes 1)
+            (byteAtOrZero len bytes 2)
+            (byteAtOrZero len bytes 3)
+  where
+    len = BS.length bytes
+{-# INLINE littleEndianWord32 #-}
+
+littleEndianWord64 :: BS.ByteString -> Word64
+littleEndianWord64 bytes
+    | len >= 8 =
+        assembleWord64
+            (BS.index bytes 0)
+            (BS.index bytes 1)
+            (BS.index bytes 2)
+            (BS.index bytes 3)
+            (BS.index bytes 4)
+            (BS.index bytes 5)
+            (BS.index bytes 6)
+            (BS.index bytes 7)
+    | otherwise =
+        assembleWord64
+            (byteAtOrZero len bytes 0)
+            (byteAtOrZero len bytes 1)
+            (byteAtOrZero len bytes 2)
+            (byteAtOrZero len bytes 3)
+            (byteAtOrZero len bytes 4)
+            (byteAtOrZero len bytes 5)
+            (byteAtOrZero len bytes 6)
+            (byteAtOrZero len bytes 7)
+  where
+    len = BS.length bytes
+{-# INLINE littleEndianWord64 #-}
+
+littleEndianInt32 :: BS.ByteString -> Int32
+littleEndianInt32 = fromIntegral . littleEndianWord32
+{-# INLINE littleEndianInt32 #-}
+
+word64ToLittleEndian :: Word64 -> BS.ByteString
+word64ToLittleEndian w =
+    BS.pack
+        [ fromIntegral w
+        , fromIntegral (w `unsafeShiftR` 8)
+        , fromIntegral (w `unsafeShiftR` 16)
+        , fromIntegral (w `unsafeShiftR` 24)
+        , fromIntegral (w `unsafeShiftR` 32)
+        , fromIntegral (w `unsafeShiftR` 40)
+        , fromIntegral (w `unsafeShiftR` 48)
+        , fromIntegral (w `unsafeShiftR` 56)
+        ]
+{-# INLINE word64ToLittleEndian #-}
+
+word32ToLittleEndian :: Word32 -> BS.ByteString
+word32ToLittleEndian w =
+    BS.pack
+        [ fromIntegral w
+        , fromIntegral (w `unsafeShiftR` 8)
+        , fromIntegral (w `unsafeShiftR` 16)
+        , fromIntegral (w `unsafeShiftR` 24)
+        ]
+{-# INLINE word32ToLittleEndian #-}
+
+byteAtOrZero :: Int -> BS.ByteString -> Int -> Word8
+byteAtOrZero len bytes i
+    | i < len = BS.index bytes i
+    | otherwise = 0
+{-# INLINE byteAtOrZero #-}
+
+assembleWord32 :: Word8 -> Word8 -> Word8 -> Word8 -> Word32
+assembleWord32 b0 b1 b2 b3 =
+    fromIntegral b0
+        .|. (fromIntegral b1 `unsafeShiftL` 8)
+        .|. (fromIntegral b2 `unsafeShiftL` 16)
+        .|. (fromIntegral b3 `unsafeShiftL` 24)
+{-# INLINE assembleWord32 #-}
+
+assembleWord64 ::
+    Word8 -> Word8 -> Word8 -> Word8 -> Word8 -> Word8 -> Word8 -> Word8 -> Word64
+assembleWord64 b0 b1 b2 b3 b4 b5 b6 b7 =
+    fromIntegral b0
+        .|. (fromIntegral b1 `unsafeShiftL` 8)
+        .|. (fromIntegral b2 `unsafeShiftL` 16)
+        .|. (fromIntegral b3 `unsafeShiftL` 24)
+        .|. (fromIntegral b4 `unsafeShiftL` 32)
+        .|. (fromIntegral b5 `unsafeShiftL` 40)
+        .|. (fromIntegral b6 `unsafeShiftL` 48)
+        .|. (fromIntegral b7 `unsafeShiftL` 56)
+{-# INLINE assembleWord64 #-}
diff --git a/src/DataFrame/Lazy/IO/Binary.hs b/src/DataFrame/Lazy/IO/Binary.hs
index a7685a8..b4529e7 100644
--- a/src/DataFrame/Lazy/IO/Binary.hs
+++ b/src/DataFrame/Lazy/IO/Binary.hs
@@ -54,6 +54,7 @@ import Data.Bits (setBit, shiftL, testBit, (.|.))
 import Data.Maybe (fromMaybe, isJust)
 import Data.Type.Equality (TestEquality (testEquality), type (:~:) (Refl))
 import Data.Word (Word16, Word32, Word64, Word8)
+import qualified DataFrame.Internal.Binary as Binary
 import DataFrame.Internal.Column (Column (..))
 import DataFrame.Internal.DataFrame (DataFrame (..))
 import Foreign (ForeignPtr, castForeignPtr, plusForeignPtr, sizeOf)
@@ -362,37 +363,12 @@ readWord16LE bs off
 readWord32LE :: BS.ByteString -> Int -> ParseResult Word32
 readWord32LE bs off
     | off + 4 > BS.length bs = Left "unexpected end of input"
-    | otherwise =
-        let b0 = fromIntegral (BSU.unsafeIndex bs off) :: Word32
-            b1 = fromIntegral (BSU.unsafeIndex bs (off + 1)) :: Word32
-            b2 = fromIntegral (BSU.unsafeIndex bs (off + 2)) :: Word32
-            b3 = fromIntegral (BSU.unsafeIndex bs (off + 3)) :: Word32
-         in Right
-                (off + 4, b0 .|. (b1 `shiftL` 8) .|. (b2 `shiftL` 16) .|. (b3 `shiftL` 24))
+    | otherwise = Right (off + 4, Binary.littleEndianWord32 (BS.drop off bs))
 
 readWord64LE :: BS.ByteString -> Int -> ParseResult Word64
 readWord64LE bs off
     | off + 8 > BS.length bs = Left "unexpected end of input"
-    | otherwise =
-        let b0 = fromIntegral (BSU.unsafeIndex bs off) :: Word64
-            b1 = fromIntegral (BSU.unsafeIndex bs (off + 1)) :: Word64
-            b2 = fromIntegral (BSU.unsafeIndex bs (off + 2)) :: Word64
-            b3 = fromIntegral (BSU.unsafeIndex bs (off + 3)) :: Word64
-            b4 = fromIntegral (BSU.unsafeIndex bs (off + 4)) :: Word64
-            b5 = fromIntegral (BSU.unsafeIndex bs (off + 5)) :: Word64
-            b6 = fromIntegral (BSU.unsafeIndex bs (off + 6)) :: Word64
-            b7 = fromIntegral (BSU.unsafeIndex bs (off + 7)) :: Word64
-         in Right
-                ( off + 8
-                , b0
-                    .|. (b1 `shiftL` 8)
-                    .|. (b2 `shiftL` 16)
-                    .|. (b3 `shiftL` 24)
-                    .|. (b4 `shiftL` 32)
-                    .|. (b5 `shiftL` 40)
-                    .|. (b6 `shiftL` 48)
-                    .|. (b7 `shiftL` 56)
-                )
+    | otherwise = Right (off + 8, Binary.littleEndianWord64 (BS.drop off bs))
 
 -- | Read @n@ consecutive Word32LE values starting at offset @off@.
 readWord32Array :: BS.ByteString -> Int -> Int -> Either String [Word32]
@@ -401,11 +377,7 @@ readWord32Array bs off n
     | otherwise =
         Right
             [ let i = off + k * 4
-                  b0 = fromIntegral (BSU.unsafeIndex bs i) :: Word32
-                  b1 = fromIntegral (BSU.unsafeIndex bs (i + 1)) :: Word32
-                  b2 = fromIntegral (BSU.unsafeIndex bs (i + 2)) :: Word32
-                  b3 = fromIntegral (BSU.unsafeIndex bs (i + 3)) :: Word32
-               in b0 .|. (b1 `shiftL` 8) .|. (b2 `shiftL` 16) .|. (b3 `shiftL` 24)
+               in Binary.littleEndianWord32 (BS.drop i bs)
             | k <- [0 .. n - 1]
             ]
 
diff --git a/tests/Parquet.hs b/tests/Parquet.hs
index 8eb699e..bbc8b40 100644
--- a/tests/Parquet.hs
+++ b/tests/Parquet.hs
@@ -7,9 +7,17 @@ import Assertions (assertExpectException)
 import qualified DataFrame as D
 import qualified DataFrame.Functions as F
 
+import qualified Data.ByteString as BS
 import Data.Int
 import Data.Text (Text)
 import Data.Time
+import Data.Word
+import DataFrame.IO.Parquet.Binary (
+    littleEndianWord32,
+    littleEndianWord64,
+    word32ToLittleEndian,
+    word64ToLittleEndian,
+ )
 import GHC.IO (unsafePerformIO)
 import Test.HUnit
 
@@ -926,6 +934,66 @@ mtCars =
             (unsafePerformIO (D.readParquet "./tests/data/mtcars.parquet"))
         )
 
+littleEndianWord64KnownPattern :: Test
+littleEndianWord64KnownPattern =
+    TestCase
+        ( assertEqual
+            "littleEndianWord64KnownPattern"
+            (0x1122334455667788 :: Word64)
+            ( littleEndianWord64
+                (BS.pack [0x88, 0x77, 0x66, 0x55, 0x44, 0x33, 0x22, 0x11])
+            )
+        )
+
+littleEndianWord32KnownPattern :: Test
+littleEndianWord32KnownPattern =
+    TestCase
+        ( assertEqual
+            "littleEndianWord32KnownPattern"
+            (0x11223344 :: Word32)
+            (littleEndianWord32 (BS.pack [0x44, 0x33, 0x22, 0x11]))
+        )
+
+littleEndianWord64ShortInputPadsZeroes :: Test
+littleEndianWord64ShortInputPadsZeroes =
+    TestCase
+        ( assertEqual
+            "littleEndianWord64ShortInputPadsZeroes"
+            (0x00CCBBAA :: Word64)
+            (littleEndianWord64 (BS.pack [0xAA, 0xBB, 0xCC]))
+        )
+
+littleEndianWord32ShortInputPadsZeroes :: Test
+littleEndianWord32ShortInputPadsZeroes =
+    TestCase
+        ( assertEqual
+            "littleEndianWord32ShortInputPadsZeroes"
+            (0x0000BEEF :: Word32)
+            (littleEndianWord32 (BS.pack [0xEF, 0xBE]))
+        )
+
+littleEndianWord64RoundTrip :: Test
+littleEndianWord64RoundTrip =
+    TestCase
+        ( assertEqual
+            "littleEndianWord64RoundTrip"
+            value
+            (littleEndianWord64 (word64ToLittleEndian value))
+        )
+  where
+    value = 0x1122334455667788 :: Word64
+
+littleEndianWord32RoundTrip :: Test
+littleEndianWord32RoundTrip =
+    TestCase
+        ( assertEqual
+            "littleEndianWord32RoundTrip"
+            value
+            (littleEndianWord32 (word32ToLittleEndian value))
+        )
+  where
+    value = 0xA1B2C3D4 :: Word32
+
 -- ---------------------------------------------------------------------------
 -- Group 1: Plain variant
 -- ---------------------------------------------------------------------------
@@ -1626,6 +1694,12 @@ tests =
     , allTypesTinyPagesLastFew
     , allTypesTinyPagesDimensions
     , transactionsTest
+    , littleEndianWord64KnownPattern
+    , littleEndianWord32KnownPattern
+    , littleEndianWord64ShortInputPadsZeroes
+    , littleEndianWord32ShortInputPadsZeroes
+    , littleEndianWord64RoundTrip
+    , littleEndianWord32RoundTrip
     , -- Group 1
       allTypesTinyPagesPlain
     , -- Group 2: compression codecs

From f9fd216212140b5a1e12ee7593ac4c4621ebe6f6 Mon Sep 17 00:00:00 2001
From: Ali Sao <asao1@uci.edu>
Date: Fri, 13 Mar 2026 09:34:17 -0700
Subject: [PATCH 2/2] refactor parquet endian decoding to use shared internal
 binary utility and remove redundant re exports; update parquet modules and
 tests to import DataFrame.Internal.Binary   directly, and fix byteAtOrZero
 bounds check to avoid unsafe indexing on negative offsets while keeping
 guarded fast path indexing unchanged

---
 src/DataFrame/IO/Parquet/Binary.hs     | 21 ---------------------
 src/DataFrame/IO/Parquet/Dictionary.hs |  6 +++++-
 src/DataFrame/IO/Parquet/Encoding.hs   |  3 ++-
 src/DataFrame/IO/Parquet/Levels.hs     |  2 +-
 src/DataFrame/IO/Parquet/Page.hs       |  5 +++++
 src/DataFrame/IO/Parquet/Time.hs       |  7 ++++++-
 src/DataFrame/Internal/Binary.hs       |  2 +-
 tests/Parquet.hs                       |  2 +-
 8 files changed, 21 insertions(+), 27 deletions(-)

diff --git a/src/DataFrame/IO/Parquet/Binary.hs b/src/DataFrame/IO/Parquet/Binary.hs
index 1f2bb62..ed71026 100644
--- a/src/DataFrame/IO/Parquet/Binary.hs
+++ b/src/DataFrame/IO/Parquet/Binary.hs
@@ -11,31 +11,10 @@ import Data.Char
 import Data.IORef
 import Data.Int
 import Data.Word
-import qualified DataFrame.Internal.Binary as Binary
 import qualified Foreign.Marshal.Alloc as Foreign
 import qualified Foreign.Ptr as Foreign
 import qualified Foreign.Storable as Foreign
 
-littleEndianWord32 :: BS.ByteString -> Word32
-littleEndianWord32 = Binary.littleEndianWord32
-{-# INLINE littleEndianWord32 #-}
-
-littleEndianWord64 :: BS.ByteString -> Word64
-littleEndianWord64 = Binary.littleEndianWord64
-{-# INLINE littleEndianWord64 #-}
-
-littleEndianInt32 :: BS.ByteString -> Int32
-littleEndianInt32 = Binary.littleEndianInt32
-{-# INLINE littleEndianInt32 #-}
-
-word64ToLittleEndian :: Word64 -> BS.ByteString
-word64ToLittleEndian = Binary.word64ToLittleEndian
-{-# INLINE word64ToLittleEndian #-}
-
-word32ToLittleEndian :: Word32 -> BS.ByteString
-word32ToLittleEndian = Binary.word32ToLittleEndian
-{-# INLINE word32ToLittleEndian #-}
-
 readUVarInt :: BS.ByteString -> (Word64, BS.ByteString)
 readUVarInt xs = loop xs 0 0 0
   where
diff --git a/src/DataFrame/IO/Parquet/Dictionary.hs b/src/DataFrame/IO/Parquet/Dictionary.hs
index dc72269..42fefae 100644
--- a/src/DataFrame/IO/Parquet/Dictionary.hs
+++ b/src/DataFrame/IO/Parquet/Dictionary.hs
@@ -17,11 +17,15 @@ import Data.Time
 import qualified Data.Vector as V
 import qualified Data.Vector.Mutable as VM
 import qualified Data.Vector.Unboxed as VU
-import DataFrame.IO.Parquet.Binary
 import DataFrame.IO.Parquet.Encoding
 import DataFrame.IO.Parquet.Levels
 import DataFrame.IO.Parquet.Time
 import DataFrame.IO.Parquet.Types
+import DataFrame.Internal.Binary (
+    littleEndianInt32,
+    littleEndianWord32,
+    littleEndianWord64,
+ )
 import qualified DataFrame.Internal.Column as DI
 import GHC.Float
 
diff --git a/src/DataFrame/IO/Parquet/Encoding.hs b/src/DataFrame/IO/Parquet/Encoding.hs
index d964bcb..6a74125 100644
--- a/src/DataFrame/IO/Parquet/Encoding.hs
+++ b/src/DataFrame/IO/Parquet/Encoding.hs
@@ -8,7 +8,8 @@ import qualified Data.ByteString.Unsafe as BSU
 import Data.List (foldl')
 import qualified Data.Vector.Unboxed as VU
 import Data.Word
-import DataFrame.IO.Parquet.Binary
+import DataFrame.IO.Parquet.Binary (readUVarInt)
+import DataFrame.Internal.Binary (littleEndianWord32)
 
 ceilLog2 :: Int -> Int
 ceilLog2 x
diff --git a/src/DataFrame/IO/Parquet/Levels.hs b/src/DataFrame/IO/Parquet/Levels.hs
index 4fa3669..c738c4e 100644
--- a/src/DataFrame/IO/Parquet/Levels.hs
+++ b/src/DataFrame/IO/Parquet/Levels.hs
@@ -5,10 +5,10 @@ import Data.Int
 import Data.List
 import qualified Data.Text as T
 
-import DataFrame.IO.Parquet.Binary
 import DataFrame.IO.Parquet.Encoding
 import DataFrame.IO.Parquet.Thrift
 import DataFrame.IO.Parquet.Types
+import DataFrame.Internal.Binary (littleEndianWord32)
 
 readLevelsV1 ::
     Int -> Int -> Int -> BS.ByteString -> ([Int], [Int], BS.ByteString)
diff --git a/src/DataFrame/IO/Parquet/Page.hs b/src/DataFrame/IO/Parquet/Page.hs
index 1def426..2fee3c3 100644
--- a/src/DataFrame/IO/Parquet/Page.hs
+++ b/src/DataFrame/IO/Parquet/Page.hs
@@ -14,6 +14,11 @@ import qualified Data.Vector.Unboxed as VU
 import DataFrame.IO.Parquet.Binary
 import DataFrame.IO.Parquet.Thrift
 import DataFrame.IO.Parquet.Types
+import DataFrame.Internal.Binary (
+    littleEndianInt32,
+    littleEndianWord32,
+    littleEndianWord64,
+ )
 import GHC.Float
 import qualified Snappy
 
diff --git a/src/DataFrame/IO/Parquet/Time.hs b/src/DataFrame/IO/Parquet/Time.hs
index ca6002f..9fbfb13 100644
--- a/src/DataFrame/IO/Parquet/Time.hs
+++ b/src/DataFrame/IO/Parquet/Time.hs
@@ -6,7 +6,12 @@ import qualified Data.ByteString as BS
 import Data.Time
 import Data.Word
 
-import DataFrame.IO.Parquet.Binary
+import DataFrame.Internal.Binary (
+    littleEndianWord32,
+    littleEndianWord64,
+    word32ToLittleEndian,
+    word64ToLittleEndian,
+ )
 
 int96ToUTCTime :: BS.ByteString -> UTCTime
 int96ToUTCTime bytes
diff --git a/src/DataFrame/Internal/Binary.hs b/src/DataFrame/Internal/Binary.hs
index 53a9f99..f4383fb 100644
--- a/src/DataFrame/Internal/Binary.hs
+++ b/src/DataFrame/Internal/Binary.hs
@@ -79,7 +79,7 @@ word32ToLittleEndian w =
 
 byteAtOrZero :: Int -> BS.ByteString -> Int -> Word8
 byteAtOrZero len bytes i
-    | i < len = BS.index bytes i
+    | i >= 0 && i < len = BS.index bytes i
     | otherwise = 0
 {-# INLINE byteAtOrZero #-}
 
diff --git a/tests/Parquet.hs b/tests/Parquet.hs
index bbc8b40..98bcfb5 100644
--- a/tests/Parquet.hs
+++ b/tests/Parquet.hs
@@ -12,7 +12,7 @@ import Data.Int
 import Data.Text (Text)
 import Data.Time
 import Data.Word
-import DataFrame.IO.Parquet.Binary (
+import DataFrame.Internal.Binary (
     littleEndianWord32,
     littleEndianWord64,
     word32ToLittleEndian,