latest/html/TritonData_8cc_source.html

 #include "larrecodnn/ImagePatternAlgs/NuSonic/Triton/TritonData.h"
 #include "larrecodnn/ImagePatternAlgs/NuSonic/Triton/triton_utils.h"
 #include "messagefacility/MessageLogger/MessageLogger.h"

 #include <cstring>
 #include <sstream>

 namespace ni = triton::common;
 namespace nic = triton::client;

 namespace lartriton {

   //dims: kept constant, represents config.pbtxt parameters of model (converted from google::protobuf::RepeatedField to vector)
   //fullShape: if batching is enabled, first entry is batch size; values can be modified
   //shape: view into fullShape, excluding batch size entry
   template <typename IO>
   TritonData<IO>::TritonData(const std::string& name,
                              const TritonData<IO>::TensorMetadata& model_info,
                              bool noBatch)
     : name_(name)
     , dims_(model_info.shape().begin(), model_info.shape().end())
     , noBatch_(noBatch)
     , batchSize_(0)
     , fullShape_(dims_)
     , shape_(fullShape_.begin() + (noBatch_ ? 0 : 1), fullShape_.end())
     , variableDims_(anyNeg(shape_))
     , productDims_(variableDims_ ? -1 : dimProduct(shape_))
     , dname_(model_info.datatype())
     , dtype_(ni::ProtocolStringToDataType(dname_))
     , byteSize_(ni::GetDataTypeByteSize(dtype_))
   {
     //create input or output object
     IO* iotmp;
     createObject(&iotmp);
     data_.reset(iotmp);
   }

   template <>
   void TritonInputData::createObject(nic::InferInput** ioptr) const
   {
     nic::InferInput::Create(ioptr, name_, fullShape_, dname_);
   }

   template <>
   void TritonOutputData::createObject(nic::InferRequestedOutput** ioptr) const
   {
     nic::InferRequestedOutput::Create(ioptr, name_);
   }

   //setters
   template <typename IO>
   bool TritonData<IO>::setShape(const TritonData<IO>::ShapeType& newShape, bool canThrow)
   {
     bool result = true;
     for (unsigned i = 0; i < newShape.size(); ++i) {
       result &= setShape(i, newShape[i], canThrow);
     }
     return result;
   }

   template <typename IO>
   bool TritonData<IO>::setShape(unsigned loc, int64_t val, bool canThrow)
   {
     std::stringstream msg;
     unsigned full_loc = loc + (noBatch_ ? 0 : 1);

     //check boundary
     if (full_loc >= fullShape_.size()) {
       msg << name_ << " setShape(): dimension " << full_loc << " out of bounds ("
           << fullShape_.size() << ")";
       if (canThrow)
         throw cet::exception("TritonDataError") << msg.str();
       else {
         MF_LOG_WARNING("TritonDataWarning") << msg.str();
         return false;
       }
     }

     if (val != fullShape_[full_loc]) {
       if (dims_[full_loc] == -1) {
         fullShape_[full_loc] = val;
         return true;
       }
       else {
         msg << name_ << " setShape(): attempt to change value of non-variable shape dimension "
             << loc;
         if (canThrow)
           throw cet::exception("TritonDataError") << msg.str();
         else {
           MF_LOG_WARNING("TritonDataError") << msg.str();
           return false;
         }
       }
     }

     return true;
   }

   template <typename IO>
   void TritonData<IO>::setBatchSize(unsigned bsize)
   {
     batchSize_ = bsize;
     if (!noBatch_) fullShape_[0] = batchSize_;
   }

   //io accessors

   template <>
   template <typename DT>
   TritonOutput<DT> TritonOutputData::fromServer() const
   {
     if (!result_) {
       throw cet::exception("TritonDataError") << name_ << " output(): missing result";
     }

     if (byteSize_ != sizeof(DT)) {
       throw cet::exception("TritonDataError")
         << name_ << " output(): inconsistent byte size " << sizeof(DT) << " (should be "
         << byteSize_ << " for " << dname_ << ")";
     }

     uint64_t nOutput = sizeShape();
     TritonOutput<DT> dataOut;
     const uint8_t* r0;
     size_t contentByteSize;
     size_t expectedContentByteSize = nOutput * byteSize_ * batchSize_;
     triton_utils::throwIfError(result_->RawData(name_, &r0, &contentByteSize),
                                "output(): unable to get raw");
     if (contentByteSize != expectedContentByteSize) {
       throw cet::exception("TritonDataError")
         << name_ << " output(): unexpected content byte size " << contentByteSize << " (expected "
         << expectedContentByteSize << ")";
     }

     const DT* r1 = reinterpret_cast<const DT*>(r0);
     dataOut.reserve(batchSize_);
     for (unsigned i0 = 0; i0 < batchSize_; ++i0) {
       auto offset = i0 * nOutput;
       dataOut.emplace_back(r1 + offset, r1 + offset + nOutput);
     }

     return dataOut;
   }

   template <>
   void TritonInputData::reset()
   {
     data_->Reset();
     holder_.reset();
   }

   template <>
   void TritonOutputData::reset()
   {
     result_.reset();
   }

   //explicit template instantiation declarations
   template class TritonData<nic::InferInput>;
   template class TritonData<nic::InferRequestedOutput>;

   template void TritonInputData::toServer(std::shared_ptr<TritonInput<float>> data_in);
   template void TritonInputData::toServer(std::shared_ptr<TritonInput<int64_t>> data_in);

   template TritonOutput<float> TritonOutputData::fromServer() const;

 }
lartriton::TritonData::name_
std::string name_
Definition: TritonData.h:118

lartriton
Definition: TritonClient.cc:23

lartriton::TritonData::setBatchSize
void setBatchSize(unsigned bsize)
Definition: TritonData.cc:100

lartriton::TritonData::setShape
bool setShape(const ShapeType &newShape)
Definition: TritonData.h:45

lartriton::TritonData::TritonData
TritonData(const std::string &name, const TensorMetadata &model_info, bool noBatch)
Definition: TritonData.cc:17

lartriton::TritonData::dims_
const ShapeType dims_
Definition: TritonData.h:120

lartriton::TritonData::holder_
std::any holder_
Definition: TritonData.h:130

lartriton::TritonData
Definition: TritonData.h:34

lartriton::TritonData::fullShape_
ShapeType fullShape_
Definition: TritonData.h:123

lartriton::TritonData::ShapeType
std::vector< int64_t > ShapeType
Definition: TritonData.h:38

triton_utils::throwIfError
void throwIfError(const Error &err, std::string_view msg)
Definition: triton_utils.cc:26

MessageLogger.h

lartriton::TritonData::toServer
void toServer(std::shared_ptr< TritonInput< DT >> ptr)
Definition: TritonData.h:50

lartriton::TritonData::byteSize_
int64_t byteSize_
Definition: TritonData.h:129

util::end
decltype(auto) constexpr end(T &&obj)
ADL-aware version of std::end.
Definition: StdUtils.h:77

lartriton::TritonInput
std::vector< std::vector< DT >> TritonInput
Definition: TritonData.h:28

lartriton::TritonData::noBatch_
bool noBatch_
Definition: TritonData.h:121

TritonData.h

lartriton::TritonData::reset
void reset()
Definition: TritonData.cc:146

lartriton::TritonData::sizeShape
int64_t sizeShape() const
Definition: TritonData.h:93

lartriton::TritonData::createObject
void createObject(IO **ioptr) const

triton_utils.h

lartriton::TritonData::batchSize_
unsigned batchSize_
Definition: TritonData.h:122

lartriton::TritonData::result_
std::shared_ptr< Result > result_
Definition: TritonData.h:131

lartriton::TritonOutput
std::vector< triton_span::Span< const DT * >> TritonOutput
Definition: TritonData.h:30

util::begin
decltype(auto) constexpr begin(T &&obj)
ADL-aware version of std::begin.
Definition: StdUtils.h:69

lartriton::TritonData::data_
std::shared_ptr< IO > data_
Definition: TritonData.h:119

lartriton::TritonData::TensorMetadata
inference::ModelMetadataResponse_TensorMetadata TensorMetadata
Definition: TritonData.h:37

MF_LOG_WARNING
#define MF_LOG_WARNING(category)
Definition: MessageLogger.h:230

lartriton::TritonData::dname_
std::string dname_
Definition: TritonData.h:127

lartriton::TritonData::fromServer
TritonOutput< DT > fromServer() const
Definition: TritonData.cc:110

fhicl::exception
cet::coded_exception< error, detail::translate > exception
Definition: exception.h:33