doc/master/merge__sorter_8h_source.html

 // -*- mode: c++; tab-width: 4; indent-tabs-mode: t; eval: (progn (c-set-style "stroustrup") (c-set-offset 'innamespace 0)); -*-

 // vi:set ts=4 sts=4 sw=4 noet :

 // Copyright 2012, The TPIE development team

 //

 // This file is part of TPIE.

 //

 // TPIE is free software: you can redistribute it and/or modify it under

 // the terms of the GNU Lesser General Public License as published by the

 // Free Software Foundation, either version 3 of the License, or (at your

 // option) any later version.

 //

 // TPIE is distributed in the hope that it will be useful, but WITHOUT ANY

 // WARRANTY; without even the implied warranty of MERCHANTABILITY or

 // FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public

 // License for more details.

 //

 // You should have received a copy of the GNU Lesser General Public License

 // along with TPIE.  If not, see <http://www.gnu.org/licenses/>


 #ifndef __TPIE_PIPELINING_MERGE_SORTER_H__

 #define __TPIE_PIPELINING_MERGE_SORTER_H__


 #include <tpie/compressed/stream.h>

 #include <tpie/pipelining/sort_parameters.h>

 #include <tpie/pipelining/merger.h>

 #include <tpie/pipelining/node.h>

 #include <tpie/pipelining/exception.h>

 #include <tpie/dummy_progress.h>

 #include <tpie/array_view.h>

 #include <tpie/parallel_sort.h>


 namespace tpie {


 namespace bits {


 class run_positions {

 public:

     run_positions();

     ~run_positions();


     static memory_size_type memory_usage();


     void open();


     void close();


     void evacuate();


     void unevacuate();


     void next_level();


     void final_level(memory_size_type fanout);


     void set_position(memory_size_type mergeLevel, memory_size_type runNumber, stream_position pos);


     stream_position get_position(memory_size_type mergeLevel, memory_size_type runNumber);


 private:

     bool m_open;

     bool m_evacuated;

     bool m_final;


     memory_size_type m_levels;


     memory_size_type m_runs[2];

     temp_file m_positionsFile[2];

     stream_position m_positionsPosition[2];

     file_stream<stream_position> m_positions[2];


     array<stream_position> m_finalPositions;

     bool m_finalExtraSet;

     stream_position m_finalExtra;

 };


 } // namespace bits


 template <typename T, bool UseProgress, typename pred_t = std::less<T>, typename store_t=default_store>

 class merge_sorter {

 private:

     typedef typename store_t::template element_type<T>::type TT;

     typedef typename store_t::template specific<TT> specific_store_t;

     typedef typename specific_store_t::outer_type outer_type;   //Should be the same as T

     typedef typename specific_store_t::store_type store_type;

     typedef typename specific_store_t::element_type element_type;   //Should be the same as TT

     typedef outer_type item_type;

     static const size_t item_size = specific_store_t::item_size;

 public:


     typedef std::shared_ptr<merge_sorter> ptr;

     typedef progress_types<UseProgress> Progress;


     static const memory_size_type defaultFiles = 253; // Default number of files available, when not using set_available_files

     static const memory_size_type minimumFilesPhase1 = 1;

     static const memory_size_type maximumFilesPhase1 = 1;

     static const memory_size_type minimumFilesPhase2 = 5;

     static const memory_size_type maximumFilesPhase2 = std::numeric_limits<memory_size_type>::max();

     static const memory_size_type minimumFilesPhase3 = 5;

     static const memory_size_type maximumFilesPhase3 = std::numeric_limits<memory_size_type>::max();


     inline merge_sorter(pred_t pred = pred_t(), store_t store = store_t())

         : m_bucketPtr(new memory_bucket())

         , m_bucket(memory_bucket_ref(m_bucketPtr.get()))

         , m_state(stNotStarted)

         , p()

         , m_parametersSet(false)

         , m_store(store.template get_specific<element_type>())

         , m_merger(pred, m_store, m_bucket)

         , m_currentRunItems(m_bucket)

         , m_maxItems(std::numeric_limits<stream_size_type>::max())

         , pred(pred)

         , m_evacuated(false)

         , m_finalMergeInitialized(false)

         , m_owning_node(nullptr)

         {}


     inline void set_parameters(memory_size_type runLength, memory_size_type fanout) {

         tp_assert(m_state == stNotStarted, "Merge sorting already begun");

         p.runLength = p.internalReportThreshold = runLength;

         p.fanout = p.finalFanout = fanout;

         m_parametersSet = true;

         log_debug() << "Manually set merge sort run length and fanout\n";

         log_debug() << "Run length =       " << p.runLength << " (uses memory " << (p.runLength*item_size + file_stream<element_type>::memory_usage()) << ")\n";

         log_debug() << "Fanout =           " << p.fanout << " (uses memory " << fanout_memory_usage(p.fanout) << ")" << std::endl;

     }


     inline void set_available_files(memory_size_type f) {

         p.filesPhase1 = p.filesPhase2 = p.filesPhase3 = f;

         check_not_started();

     }


     inline void set_available_files(memory_size_type f1, memory_size_type f2, memory_size_type f3) {

         p.filesPhase1 = f1;

         p.filesPhase2 = f2;

         p.filesPhase3 = f3;

         check_not_started();

     }


     inline void set_available_memory(memory_size_type m) {

         p.memoryPhase1 = p.memoryPhase2 = p.memoryPhase3 = m;

         check_not_started();

     }


     inline void set_available_memory(memory_size_type m1, memory_size_type m2, memory_size_type m3) {

         p.memoryPhase1 = m1;

         p.memoryPhase2 = m2;

         p.memoryPhase3 = m3;

         check_not_started();

     }


 private:

     // Checks if we should still be able to change parameters

     inline void check_not_started() {

         if (m_state != stNotStarted) {

             throw tpie::exception("Can't change parameters after merge sorting has started");

         }

     }


 public:

     inline void set_phase_1_files(memory_size_type f1) {

         p.filesPhase1 = f1;

         check_not_started();

     }


     inline void set_phase_2_files(memory_size_type f2) {

         p.filesPhase2 = f2;

         check_not_started();

     }


     inline void set_phase_3_files(memory_size_type f3) {

         p.filesPhase3 = f3;

         check_not_started();

     }


     inline void set_phase_1_memory(memory_size_type m1) {

         p.memoryPhase1 = m1;

         check_not_started();

     }


     inline void set_phase_2_memory(memory_size_type m2) {

         p.memoryPhase2 = m2;

         check_not_started();

     }


     inline void set_phase_3_memory(memory_size_type m3) {

         p.memoryPhase3 = m3;

         check_not_started();

     }


     inline void begin() {

         tp_assert(m_state == stNotStarted, "Merge sorting already begun");

         if (!m_parametersSet) calculate_parameters();

         log_debug() << "Start forming input runs" << std::endl;

         m_currentRunItems = array<store_type>(0, allocator<store_type>(m_bucket));

         m_currentRunItems.resize((size_t)p.runLength);

         m_runFiles.resize(p.fanout*2);

         m_currentRunItemCount = 0;

         m_finishedRuns = 0;

         m_state = stRunFormation;

         m_itemCount = 0;

     }


     inline void push(item_type && item) {

         tp_assert(m_state == stRunFormation, "Wrong phase");

         if (m_currentRunItemCount >= p.runLength) {

             sort_current_run();

             empty_current_run();

         }

         m_currentRunItems[m_currentRunItemCount] = m_store.outer_to_store(std::move(item));

         ++m_currentRunItemCount;

         ++m_itemCount;

     }


     inline void push(const item_type & item) {

         tp_assert(m_state == stRunFormation, "Wrong phase");

         if (m_currentRunItemCount >= p.runLength) {

             sort_current_run();

             empty_current_run();

         }

         m_currentRunItems[m_currentRunItemCount] = m_store.outer_to_store(item);

         ++m_currentRunItemCount;

         ++m_itemCount;

     }


     inline void end() {

         tp_assert(m_state == stRunFormation, "Wrong phase");

         sort_current_run();


         if (m_itemCount == 0) {

             tp_assert(m_currentRunItemCount == 0, "m_itemCount == 0, but m_currentRunItemCount != 0");

             m_reportInternal = true;

             m_itemsPulled = 0;

             m_currentRunItems.resize(0);

             log_debug() << "Got no items. Internal reporting mode." << std::endl;

         } else if (m_finishedRuns == 0 && m_currentRunItems.size() <= p.internalReportThreshold) {

             // Our current buffer fits within the memory requirements of phase 2.

             m_reportInternal = true;

             m_itemsPulled = 0;

             log_debug() << "Got " << m_currentRunItemCount << " items. Internal reporting mode." << std::endl;


         } else if (m_finishedRuns == 0

                    && m_currentRunItemCount <= p.internalReportThreshold

                    && array<store_type>::memory_usage(m_currentRunItemCount) <= get_memory_manager().available()) {

             // Our current buffer does not fit within the memory requirements

             // of phase 2, but we have enough temporary memory to copy and

             // resize the buffer.


             array<store_type> currentRun(m_currentRunItemCount);

             for (size_t i=0; i < m_currentRunItemCount; ++i)

                 currentRun[i] = std::move(m_currentRunItems[i]);

             m_currentRunItems.swap(currentRun);


             m_reportInternal = true;

             m_itemsPulled = 0;

             log_debug() << "Got " << m_currentRunItemCount << " items. Internal reporting mode "

                 << "after resizing item buffer." << std::endl;


         } else {

             m_reportInternal = false;

             empty_current_run();

             m_currentRunItems.resize(0);

             log_debug() << "Got " << m_finishedRuns << " runs. External reporting mode." << std::endl;

         }

         m_state = stMerge;

     }


     inline bool is_calc_free() const {

         tp_assert(m_state == stMerge, "Wrong phase");

         return m_reportInternal || m_finishedRuns <= p.fanout;

     }


     inline void calc(typename Progress::base & pi) {

         tp_assert(m_state == stMerge, "Wrong phase");

         if (!m_reportInternal) {

             prepare_pull(pi);

         } else {

             pi.init(1);

             pi.step();

             pi.done();

         }

         m_state = stReport;

     }


     inline void evacuate() {

         tp_assert(m_state == stMerge || m_state == stReport, "Wrong phase");

         if (m_reportInternal) {

             log_debug() << "Evacuate merge_sorter (" << this << ") in internal reporting mode" << std::endl;

             m_reportInternal = false;

             memory_size_type runCount = (m_currentRunItemCount > 0) ? 1 : 0;

             empty_current_run();

             m_currentRunItems.resize(0);

             initialize_final_merger(0, runCount);

         } else if (m_state == stMerge) {

             log_debug() << "Evacuate merge_sorter (" << this << ") before merge in external reporting mode (noop)" << std::endl;

             m_runPositions.evacuate();

             return;

         }

         log_debug() << "Evacuate merge_sorter (" << this << ") before reporting in external reporting mode" << std::endl;

         m_merger.reset();

         m_evacuated = true;

         m_runPositions.evacuate();

     }


     inline void evacuate_before_merging() {

         if (m_state == stMerge) evacuate();

     }


     inline void evacuate_before_reporting() {

         if (m_state == stReport && (!m_reportInternal || m_itemsPulled == 0)) evacuate();

     }


 private:

     // Phase 1 helpers.


     inline void sort_current_run() {

         parallel_sort(m_currentRunItems.begin(), m_currentRunItems.begin()+m_currentRunItemCount,

                       bits::store_pred<pred_t, specific_store_t>(pred));

     }


     // postcondition: m_currentRunItemCount = 0

     inline void empty_current_run() {

         if (m_finishedRuns < 10)

             log_debug() << "Write " << m_currentRunItemCount << " items to run file " << m_finishedRuns << std::endl;

         else if (m_finishedRuns == 10)

             log_debug() << "..." << std::endl;

         file_stream<element_type> fs;

         open_run_file_write(fs, 0, m_finishedRuns);

         for (memory_size_type i = 0; i < m_currentRunItemCount; ++i)

             fs.write(m_store.store_to_element(std::move(m_currentRunItems[i])));

         m_currentRunItemCount = 0;

         ++m_finishedRuns;

     }


     inline void initialize_merger(memory_size_type mergeLevel, memory_size_type runNumber, memory_size_type runCount) {

         // runCount is a memory_size_type since we must be able to have that

         // many file_streams open at the same time.


         // Open files and seek to the first item in the run.

         array<file_stream<element_type> > in(runCount);

         for (memory_size_type i = 0; i < runCount; ++i) {

             open_run_file_read(in[i], mergeLevel, runNumber+i);

         }

         stream_size_type runLength = calculate_run_length(p.runLength, p.fanout, mergeLevel);

         // Pass file streams with correct stream offsets to the merger

         m_merger.reset(in, runLength);

     }


     inline void initialize_final_merger(memory_size_type finalMergeLevel, memory_size_type runCount) {

         if (m_finalMergeInitialized) {

             reinitialize_final_merger();

             return;

         }


         m_finalMergeInitialized = true;

         m_finalMergeLevel = finalMergeLevel;

         m_finalRunCount = runCount;

         m_runPositions.next_level();

         m_runPositions.final_level(p.fanout);

         if (runCount > p.finalFanout) {

             log_debug() << "Run count in final level (" << runCount << ") is greater than the final fanout (" << p.finalFanout << ")\n";


             memory_size_type i = p.finalFanout-1;

             memory_size_type n = runCount-i;

             log_debug() << "Merge " << n << " runs starting from #" << i << std::endl;

             dummy_progress_indicator pi;

             m_finalMergeSpecialRunNumber = merge_runs(finalMergeLevel, i, n, pi);

         } else {

             log_debug() << "Run count in final level (" << runCount << ") is less or equal to the final fanout (" << p.finalFanout << ")" << std::endl;

             m_finalMergeSpecialRunNumber = std::numeric_limits<memory_size_type>::max();

         }

         reinitialize_final_merger();

     }


 public:

     inline void reinitialize_final_merger() {

         tp_assert(m_finalMergeInitialized, "reinitialize_final_merger while !m_finalMergeInitialized");

         m_runPositions.unevacuate();

         if (m_finalMergeSpecialRunNumber != std::numeric_limits<memory_size_type>::max()) {

             array<file_stream<element_type> > in(p.finalFanout);

             for (memory_size_type i = 0; i < p.finalFanout-1; ++i) {

                 open_run_file_read(in[i], m_finalMergeLevel, i);

                 log_debug() << "Run " << i << " is at offset " << in[i].offset() << " and has size " << in[i].size() << std::endl;

             }

             open_run_file_read(in[p.finalFanout-1], m_finalMergeLevel+1, m_finalMergeSpecialRunNumber);

             log_debug() << "Special large run is at offset " << in[p.finalFanout-1].offset() << " and has size " << in[p.finalFanout-1].size() << std::endl;

             stream_size_type runLength = calculate_run_length(p.runLength, p.fanout, m_finalMergeLevel+1);

             log_debug() << "Run length " << runLength << std::endl;

             m_merger.reset(in, runLength);

         } else {

             initialize_merger(m_finalMergeLevel, 0, m_finalRunCount);

         }

         m_evacuated = false;

     }


 private:

     static inline stream_size_type calculate_run_length(stream_size_type initialRunLength, memory_size_type fanout, memory_size_type mergeLevel) {

         stream_size_type runLength = initialRunLength;

         for (memory_size_type i = 0; i < mergeLevel; ++i) {

             runLength *= fanout;

         }

         return runLength;

     }


     template <typename ProgressIndicator>

     inline memory_size_type merge_runs(memory_size_type mergeLevel, memory_size_type runNumber, memory_size_type runCount, ProgressIndicator & pi) {

         initialize_merger(mergeLevel, runNumber, runCount);

         file_stream<element_type> out;

         memory_size_type nextRunNumber = runNumber/p.fanout;

         open_run_file_write(out, mergeLevel+1, nextRunNumber);

         while (m_merger.can_pull()) {

             pi.step();

             out.write(m_store.store_to_element(m_merger.pull()));

         }

         return nextRunNumber;

     }


     inline void prepare_pull(typename Progress::base & pi) {

         m_runPositions.unevacuate();


         // Compute merge depth (number of passes over data).

         int treeHeight= static_cast<int>(ceil(log(static_cast<float>(m_finishedRuns)) /

                                               log(static_cast<float>(p.fanout))));

         pi.init(item_count()*treeHeight);


         memory_size_type mergeLevel = 0;

         memory_size_type runCount = m_finishedRuns;

         while (runCount > p.fanout) {

             log_debug() << "Merge " << runCount << " runs in merge level " << mergeLevel << '\n';

             m_runPositions.next_level();

             memory_size_type newRunCount = 0;

             for (memory_size_type i = 0; i < runCount; i += p.fanout) {

                 memory_size_type n = std::min(runCount-i, p.fanout);


                 if (newRunCount < 10)

                     log_debug() << "Merge " << n << " runs starting from #" << i << std::endl;

                 else if (newRunCount == 10)

                     log_debug() << "..." << std::endl;


                 merge_runs(mergeLevel, i, n, pi);

                 ++newRunCount;

             }

             ++mergeLevel;

             runCount = newRunCount;

         }

         log_debug() << "Final merge level " << mergeLevel << " has " << runCount << " runs" << std::endl;

         initialize_final_merger(mergeLevel, runCount);


         m_state = stReport;

         pi.done();

     }


 public:

     inline bool can_pull() {

         tp_assert(m_state == stReport, "Wrong phase");

         if (m_reportInternal) return m_itemsPulled < m_currentRunItemCount;

         else {

             if (m_evacuated) reinitialize_final_merger();

             return m_merger.can_pull();

         }

     }


     inline item_type pull() {

         tp_assert(m_state == stReport, "Wrong phase");

         if (m_reportInternal && m_itemsPulled < m_currentRunItemCount) {

             store_type el = std::move(m_currentRunItems[m_itemsPulled++]);

             if (!can_pull()) m_currentRunItems.resize(0);

             return m_store.store_to_outer(std::move(el));

         } else {

             if (m_evacuated) reinitialize_final_merger();

             m_runPositions.close();

             return m_store.store_to_outer(m_merger.pull());

         }

     }


     inline stream_size_type item_count() {

         return m_itemCount;

     }


     static memory_size_type memory_usage_phase_1(const sort_parameters & params) {

         return params.runLength * item_size

             + bits::run_positions::memory_usage()

             + file_stream<element_type>::memory_usage()

             + 2*params.fanout*sizeof(temp_file);

     }


     static memory_size_type minimum_memory_phase_1() {

         // Our *absolute minimum* memory requirements are a single item and

         // twice as many temp_files as the fanout.

         // However, our fanout calculation does not take the memory available

         // in this phase (run formation) into account.

         // Thus, we assume the largest fanout, meaning we might overshoot.

         // If we do overshoot, we will just spend the extra bytes on a run length

         // longer than 1, which is probably what the user wants anyway.

         sort_parameters tmp_p((sort_parameters()));

         tmp_p.runLength = 1;

         tmp_p.fanout = calculate_fanout(std::numeric_limits<memory_size_type>::max(), 0);

         return memory_usage_phase_1(tmp_p);

     }


     static memory_size_type memory_usage_phase_2(const sort_parameters & params) {

         return fanout_memory_usage(params.fanout);

     }


     static memory_size_type minimum_memory_phase_2() {

         return fanout_memory_usage(calculate_fanout(0, 0));

     }


     static memory_size_type memory_usage_phase_3(const sort_parameters & params) {

         return fanout_memory_usage(params.finalFanout);

     }


     static memory_size_type minimum_memory_phase_3() {

         return fanout_memory_usage(calculate_fanout(0, 0));

     }


     static memory_size_type maximum_memory_phase_3() {

         return std::numeric_limits<memory_size_type>::max();

     }


     memory_size_type actual_memory_phase_3() {

         tp_assert(m_state == stReport, "Wrong phase");

         if (m_reportInternal)

             return m_runFiles.memory_usage(m_runFiles.size())

                 + m_currentRunItems.memory_usage(m_currentRunItems.size());

         else

             return fanout_memory_usage(m_finalRunCount);

     }


     inline memory_size_type evacuated_memory_usage() const {

         return 2*p.fanout*sizeof(temp_file);

     }


 private:

     static memory_size_type clamp(memory_size_type lo, memory_size_type val, memory_size_type hi) {

         return std::max(lo, std::min(val, hi));

     }


     inline void calculate_parameters() {

         tp_assert(m_state == stNotStarted, "Merge sorting already begun");


         if(!p.filesPhase1)

             p.filesPhase1 = clamp(minimumFilesPhase1, defaultFiles, maximumFilesPhase1);

         if(!p.filesPhase2)

             p.filesPhase2 = clamp(minimumFilesPhase2, defaultFiles, maximumFilesPhase2);

         if(!p.filesPhase3)

             p.filesPhase3 = clamp(minimumFilesPhase3, defaultFiles, maximumFilesPhase3);


         if(p.filesPhase1 < minimumFilesPhase1)

             throw tpie::exception("file limit for phase 1 too small (" + std::to_string(p.filesPhase1) + " < " + std::to_string(minimumFilesPhase1) + ")");

         if(p.filesPhase2 < minimumFilesPhase2)

             throw tpie::exception("file limit for phase 2 too small (" + std::to_string(p.filesPhase2) + " < " + std::to_string(minimumFilesPhase2) + ")");

         if(p.filesPhase3 < minimumFilesPhase3)

             throw tpie::exception("file limit for phase 3 too small (" + std::to_string(p.filesPhase3) + " < " + std::to_string(minimumFilesPhase3) + ")");


         if (!p.filesPhase1)

             throw tpie::exception("memory limit for phase 1 not set");

         if (!p.filesPhase2)

             throw tpie::exception("memory limit for phase 2 not set");

         if (!p.filesPhase3)

             throw tpie::exception("memory limit for phase 3 not set");


         // We must set aside memory for temp_files in m_runFiles.

         // m_runFiles contains fanout*2 temp_files, so calculate fanout before run length.


         // Phase 2 (merge):

         // Run length: unbounded

         // Fanout: determined by the size of our merge heap and the stream memory usage.

         log_debug() << "Phase 2: " << p.memoryPhase2 << " b available memory\n";

         p.fanout = calculate_fanout(p.memoryPhase2, p.filesPhase2);

         if (fanout_memory_usage(p.fanout) > p.memoryPhase2) {

             log_debug() << "Not enough memory for fanout " << p.fanout << "! (" << p.memoryPhase2 << " < " << fanout_memory_usage(p.fanout) << ")\n";

             p.memoryPhase2 = fanout_memory_usage(p.fanout);

         }


         // Phase 3 (final merge & report):

         // Run length: unbounded

         // Fanout: determined by the stream memory usage.

         log_debug() << "Phase 3: " << p.memoryPhase3 << " b available memory\n";

         p.finalFanout = calculate_fanout(p.memoryPhase3, p.filesPhase3);


         if (p.finalFanout > p.fanout)

             p.finalFanout = p.fanout;


         if (fanout_memory_usage(p.finalFanout) > p.memoryPhase3) {

             log_debug() << "Not enough memory for fanout " << p.finalFanout << "! (" << p.memoryPhase3 << " < " << fanout_memory_usage(p.finalFanout) << ")\n";

             p.memoryPhase3 = fanout_memory_usage(p.finalFanout);

         }


         // Phase 1 (run formation):

         // Run length: determined by the number of items we can hold in memory.

         // Fanout: unbounded


         memory_size_type streamMemory = file_stream<element_type>::memory_usage();

         memory_size_type tempFileMemory = 2*p.fanout*sizeof(temp_file);


         log_debug() << "Phase 1: " << p.memoryPhase1 << " b available memory; " << streamMemory << " b for a single stream; " << tempFileMemory << " b for temp_files\n";

         memory_size_type min_m1 = 128*1024 / item_size + bits::run_positions::memory_usage() + streamMemory + tempFileMemory;

         if (p.memoryPhase1 < min_m1) {

             log_warning() << "Not enough phase 1 memory for 128 KB items and an open stream! (" << p.memoryPhase1 << " < " << min_m1 << ")\n";

             p.memoryPhase1 = min_m1;

         }

         p.runLength = (p.memoryPhase1 - bits::run_positions::memory_usage() - streamMemory - tempFileMemory)/item_size;


         p.internalReportThreshold = (std::min(p.memoryPhase1,

                                               std::min(p.memoryPhase2,

                                                        p.memoryPhase3))

                                      - tempFileMemory)/item_size;

         if (p.internalReportThreshold > p.runLength)

             p.internalReportThreshold = p.runLength;


         m_parametersSet = true;


             set_items(m_maxItems);


         log_debug() << "Calculated merge sort parameters\n";

         p.dump(log_debug());

         log_debug() << std::endl;


         log_debug() << "Merge sort phase 1: "

             << p.memoryPhase1 << " b available, " << memory_usage_phase_1(p) << " b expected" << std::endl;

         if (memory_usage_phase_1(p) > p.memoryPhase1) {

             log_warning() << "Merge sort phase 1 exceeds the alloted memory usage: "

                 << p.memoryPhase1 << " b available, but " << memory_usage_phase_1(p) << " b expected" << std::endl;

         }

         log_debug() << "Merge sort phase 2: "

             << p.memoryPhase2 << " b available, " << memory_usage_phase_2(p) << " b expected" << std::endl;

         if (memory_usage_phase_2(p) > p.memoryPhase2) {

             log_warning() << "Merge sort phase 2 exceeds the alloted memory usage: "

                 << p.memoryPhase2 << " b available, but " << memory_usage_phase_2(p) << " b expected" << std::endl;

         }

         log_debug() << "Merge sort phase 3: "

             << p.memoryPhase3 << " b available, " << memory_usage_phase_3(p) << " b expected" << std::endl;

         if (memory_usage_phase_3(p) > p.memoryPhase3) {

             log_warning() << "Merge sort phase 3 exceeds the alloted memory usage: "

                 << p.memoryPhase3 << " b available, but " << memory_usage_phase_3(p) << " b expected" << std::endl;

         }

     }


     static inline memory_size_type calculate_fanout(memory_size_type availableMemory, memory_size_type availableFiles) {

         memory_size_type fanout_lo = 2;

         memory_size_type fanout_hi = availableFiles - 2;

         // binary search

         while (fanout_lo < fanout_hi - 1) {

             memory_size_type mid = fanout_lo + (fanout_hi-fanout_lo)/2;

             if (fanout_memory_usage(mid) <= availableMemory) {

                 fanout_lo = mid;

             } else {

                 fanout_hi = mid;

             }

         }

         return fanout_lo;

     }


     static inline memory_size_type fanout_memory_usage(memory_size_type fanout) {

         return merger<specific_store_t, pred_t>::memory_usage(fanout) // accounts for the `fanout' open streams

             + bits::run_positions::memory_usage()

             + file_stream<element_type>::memory_usage() // output stream

             + 2*sizeof(temp_file); // merge_sorter::m_runFiles

     }


 public:

     void set_items(stream_size_type n) {

         if (m_state != stNotStarted)

             throw exception("Wrong state in set_items: state is not stNotStarted");


         m_maxItems = n;


         if (!m_parametersSet) {

             // We will handle this later in calculate_parameters

             return;

         }


         // If the item upper bound is less than a run,

         // then it might pay off to decrease the length of a run

         // so that we can avoid I/O altogether.

         if (m_maxItems < p.runLength) {

             memory_size_type newRunLength =

                 std::max(memory_size_type(m_maxItems), p.internalReportThreshold);

             log_debug() << "Decreasing run length from " << p.runLength

                 << " to " << newRunLength

                 << " since at most " << m_maxItems << " items will be pushed,"

                 << " and the internal report threshold is "

                 << p.internalReportThreshold

                 << ". New merge sort parameters:\n";

             // In principle, we could decrease runLength to m_maxItems,

             // but setting runLength below internalReportThreshold does not

             // give additional benefits.

             // Furthermore, buggy code could call set_items with a very low

             // upper bound, leading to unacceptable performance in practice;

             // thus, internalReportThreshold is used as a stopgap/failsafe.

             p.runLength = newRunLength;

             p.dump(log_debug());

             log_debug() << std::endl;

         }

     }


     void set_owner(tpie::pipelining::node * n) {

         if (m_owning_node != nullptr)

             m_bucketPtr = std::move(m_owning_node->bucket(0));


         if (n != nullptr)

             n->bucket(0) = std::move(m_bucketPtr);


         m_owning_node = n;

     }

 private:

     inline memory_size_type run_file_index(memory_size_type mergeLevel, memory_size_type runNumber) {

         // runNumber is a memory_size_type since it is used as an index into

         // m_runFiles.


         return (mergeLevel % 2)*p.fanout + (runNumber % p.fanout);

     }


     void open_run_file_write(file_stream<element_type> & fs, memory_size_type mergeLevel, memory_size_type runNumber) {

         // see run_file_index comment about runNumber


         memory_size_type idx = run_file_index(mergeLevel, runNumber);

         if (runNumber < p.fanout) m_runFiles[idx].free();

         fs.open(m_runFiles[idx], access_read_write, 0, access_sequential, compression_normal);

         fs.seek(0, file_stream_base::end);

         m_runPositions.set_position(mergeLevel, runNumber, fs.get_position());

     }


     void open_run_file_read(file_stream<element_type> & fs, memory_size_type mergeLevel, memory_size_type runNumber) {

         // see run_file_index comment about runNumber


         memory_size_type idx = run_file_index(mergeLevel, runNumber);

         fs.open(m_runFiles[idx], access_read, 0, access_sequential, compression_normal);

         fs.set_position(m_runPositions.get_position(mergeLevel, runNumber));

     }


     enum state_type {

         stNotStarted,

         stRunFormation,

         stMerge,

         stReport

     };


     std::unique_ptr<memory_bucket> m_bucketPtr;

     memory_bucket_ref m_bucket;


     array<temp_file> m_runFiles;


     state_type m_state;


     sort_parameters p;

     bool m_parametersSet;


     specific_store_t m_store;

     merger<specific_store_t, pred_t> m_merger;


     bits::run_positions m_runPositions;


     // Number of runs already written to disk.

     // On 32-bit systems, we could in principle support more than 2^32 finished runs,

     // but keeping this as a memory_size_type is nicer when doing the actual merges.

     stream_size_type m_finishedRuns;


     // current run buffer. size 0 before begin(), size runLength after begin().

     array<store_type> m_currentRunItems;


     // Number of items in current run buffer.

     // Used to index into m_currentRunItems, so memory_size_type.

     memory_size_type m_currentRunItemCount;


     bool m_reportInternal;


     // When doing internal reporting: the number of items already reported

     // Used in comparison with m_currentRunItemCount

     memory_size_type m_itemsPulled;


     stream_size_type m_itemCount;


     stream_size_type m_maxItems;


     pred_t pred;

     bool m_evacuated;

     bool m_finalMergeInitialized;

     memory_size_type m_finalMergeLevel;

     memory_size_type m_finalRunCount;

     memory_size_type m_finalMergeSpecialRunNumber;


     tpie::pipelining::node * m_owning_node;

 };


 } // namespace tpie


 #endif // __TPIE_PIPELINING_MERGE_SORTER_H__

tpie::access_sequential
Sequential access is intended.
Definition: cache_hint.h:36

array_view.h
Encapsulation of two pointers from any random access container.

tpie::sort_parameters::runLength
memory_size_type runLength
Run length, subject to memory restrictions during phase 2.
Definition: sort_parameters.h:46

tpie::bits::run_positions::unevacuate
void unevacuate()
Switch from any state to the corresponding non-evacuated state.

tpie::merge_sorter::set_available_memory
void set_available_memory(memory_size_type m)
Calculate parameters from given memory amount.
Definition: merge_sorter.h:228

tpie::bits::run_positions
Class to maintain the positions where sorted runs start.
Definition: merge_sorter.h:61

tpie::merge_sorter::pull
item_type pull()
In phase 3, fetch next item in the final merge phase.
Definition: merge_sorter.h:597

tpie::progress_indicator_base
The base class for indicating the progress of some task.
Definition: progress_indicator_base.h:61

tpie::sort_parameters::filesPhase3
memory_size_type filesPhase3
files available during output phase.
Definition: sort_parameters.h:38

tpie::parallel_sort
void parallel_sort(iterator_type a, iterator_type b, typename tpie::progress_types< Progress >::base &pi, comp_type comp=std::less< typename boost::iterator_value< iterator_type >::type >())
Sort items in the range [a,b) using a parallel quick sort.
Definition: parallel_sort.h:294

tpie::array
A generic array with a fixed size.
Definition: array.h:144

tpie::merge_sorter::set_available_memory
void set_available_memory(memory_size_type m1, memory_size_type m2, memory_size_type m3)
Calculate parameters from given memory amount.
Definition: merge_sorter.h:239

tpie::linear_memory_base::memory_usage
static memory_size_type memory_usage(memory_size_type size)
Return the number of bytes required to create a data structure supporting a given number of elements...
Definition: util.h:81

tpie::merge_sorter::set_available_files
void set_available_files(memory_size_type f1, memory_size_type f2, memory_size_type f3)
Calculate parameters from given amount of files.
Definition: merge_sorter.h:217

tpie::merge_sorter
Merge sorting consists of three phases.
Definition: merge_sorter.h:150

tpie::progress_indicator_base::done
virtual void done()
Advance the indicator to the end.
Definition: progress_indicator_base.h:129

tpie::sort_parameters::internalReportThreshold
memory_size_type internalReportThreshold
Maximum item count for internal reporting, subject to memory restrictions in all phases.
Definition: sort_parameters.h:49

tpie::access_read
Open a file for reading.
Definition: access_type.h:31

stream.h
Compressed stream public API.

tpie::bits::run_positions::memory_usage
static memory_size_type memory_usage()
Memory usage when open and not evacuated.

tpie::pipelining::node
Base class of all nodes.
Definition: node.h:78

tpie::sort_parameters::memoryPhase3
memory_size_type memoryPhase3
Memory available during output phase.
Definition: sort_parameters.h:40

tpie::stream_position
POD object indicating the position of an item in a stream.
Definition: stream_position.h:72

tpie::sort_parameters::filesPhase2
memory_size_type filesPhase2
files available while merging runs.
Definition: sort_parameters.h:34

parallel_sort.h
Simple parallel quick sort implementation with progress tracking.

tpie::allocator
A allocator object usable in STL containers, using the TPIE memory manager.
Definition: memory.h:390

tpie::memory_bucket_ref
Class storring a reference to a memory bucket.
Definition: memory.h:366

tpie::merge_sorter::set_items
void set_items(stream_size_type n)
Set upper bound on number of items pushed.
Definition: merge_sorter.h:814

tpie::get_memory_manager
memory_manager & get_memory_manager()
Return a reference to the memory manager.

tpie::sort_parameters::finalFanout
memory_size_type finalFanout
Fanout of merge tree during phase 3.
Definition: sort_parameters.h:53

tpie::bits::run_positions::final_level
void final_level(memory_size_type fanout)
Set this to be the final level in the merge heap - see class docstring.

tpie::temp_file
Class representing a reference to a temporary file.
Definition: tempname.h:202

tpie::merge_sorter::can_pull
bool can_pull()
In phase 3, return true if there are more items in the final merge phase.
Definition: merge_sorter.h:585

tpie::progress_indicator_base::step
void step(stream_size_type step=1)
Record an increment to the indicator and advance the indicator.
Definition: progress_indicator_base.h:90

tpie::memory_bucket
Bucket used for memory counting.
Definition: memory.h:352

tpie::bits::run_positions::set_position
void set_position(memory_size_type mergeLevel, memory_size_type runNumber, stream_position pos)
Store a stream position - see class docstring.

tpie::log_debug
logstream & log_debug()
Return logstream for writing debug log messages.
Definition: tpie_log.h:167

tpie::merge_sorter::end
void end()
End phase 1.
Definition: merge_sorter.h:329

tpie::sort_parameters::memoryPhase2
memory_size_type memoryPhase2
Memory available while merging runs.
Definition: sort_parameters.h:36

tpie::bits::run_positions::next_level
void next_level()
Go to next level in the merge heap - see class docstring.

tpie::array::resize
void resize(size_t size, const T &elm)
Change the size of the array.
Definition: array.h:485

tpie::bits::run_positions::close
void close()
Switch from any state to closed state.

tpie::pipelining::node::bucket
std::unique_ptr< memory_bucket > & bucket(size_t i)
Access a memory bucket.
Definition: node.h:779

tpie::bits::run_positions::open
void open()
Switch from closed to open state.

tpie::exception
Definition: exception.h:33

tpie::file_stream
Compressed stream.
Definition: predeclare.h:46

tpie::array::swap
void swap(array &other)
Swap two arrays.
Definition: array.h:499

tpie::compression_normal
Compress some blocks according to available resources (time, memory).
Definition: scheme.h:40

tpie::array::begin
iterator begin()
Return an iterator to the beginning of the array.
Definition: array.h:307

tpie::array::size
size_type size() const
Return the size of the array.
Definition: array.h:526

tpie::bits::run_positions::evacuate
void evacuate()
Switch from any state to the corresponding evacuated state.

tpie::merge_sorter::begin
void begin()
Initiate phase 1: Formation of input runs.
Definition: merge_sorter.h:288

tpie::merge_sorter::push
void push(item_type &&item)
Push item to merge sorter during phase 1.
Definition: merge_sorter.h:304

tpie::merge_sorter::set_parameters
void set_parameters(memory_size_type runLength, memory_size_type fanout)
Enable setting run length and fanout manually (for testing purposes).
Definition: merge_sorter.h:192

tpie::sort_parameters::filesPhase1
memory_size_type filesPhase1
files available while forming sorted runs.
Definition: sort_parameters.h:30

tp_assert
#define tp_assert(condition, message)
Definition: tpie_assert.h:48

tpie::merge_sorter::calc
void calc(typename Progress::base &pi)
Perform phase 2: Performing all merges in the merge tree except the last one.
Definition: merge_sorter.h:380

tpie::progress_types
For applications where you wish to disable progress indicators via a template parameter, refer to progress_types members names sub, fp and base.
Definition: dummy_progress.h:127

tpie::bits::run_positions::get_position
stream_position get_position(memory_size_type mergeLevel, memory_size_type runNumber)
Fetch a stream position - see class docstring.

tpie::log_warning
logstream & log_warning()
Return logstream for writing warning log messages.
Definition: tpie_log.h:157

tpie::merge_sorter::set_available_files
void set_available_files(memory_size_type f)
Calculate parameters from given amount of files.
Definition: merge_sorter.h:206

tpie::sort_parameters::fanout
memory_size_type fanout
Fanout of merge tree during phase 2.
Definition: sort_parameters.h:51

dummy_progress.h
Progress indicator concept in an efficient non-inheritance way.

tpie::access_read_write
Open a file for reading or writing.
Definition: access_type.h:35

tpie::progress_indicator_base::init
virtual void init(stream_size_type range=0)
Initialize progress indicator.
Definition: progress_indicator_base.h:120

tpie::sort_parameters::memoryPhase1
memory_size_type memoryPhase1
memory available while forming sorted runs.
Definition: sort_parameters.h:32