Filip is available for hire

Filip Boltuzic

Verified Expert in Engineering

机器学习工程师和开发人员

Location

Zagreb, Croatia

至今成员总数

April 30, 2020

Filip是一名拥有多年专业经验的机器学习工程师. 作为软件开发人员，他曾在亚马逊网络服务公司(Amazon Web Services)从事大规模问题的研究，并在萨格勒布大学(University of Zagreb)担任助理研究员，建立了自然语言处理模型. 菲利普的主要兴趣是机器学习和自然语言处理, 重点是建立文本分类模型.

自然语言处理(NLP)人工智能(AI)Machine Learning Back-end Data Analysis Python Scikit-learn NumPy Pandas SQL 亚马逊网络服务(AWS)PyTorch Big Data Clustering Web Scraping Hugging Face Haskell LLaMA 2

Portfolio

在线自由职业机构

机器学习，监督机器学习，强化学习...

Inflexion

聊天语言，干草堆，自然语言处理(NLP)，机器学习...

Agnostiq

机器学习、Python、DevOps、数据科学、亚马逊网络服务(AWS)...

Experience

Python - 10 years Linux - 7 years 机器学习- 6年数据科学- 6年自然语言处理(NLP) - 6年 Scikit-learn - 6年生成预训练变形金刚(GPT) - 3年 GPT - 3 years

Availability

Full-time

首选的环境

Java, Git, Linux, Docker, Apache Solr, Django, PyTorch, Pandas, NumPy, Scikit-learn, Python

The most amazing...

...我开发的机器学习模型是一个LSTM和CRF模型，用于将文本分割为论证性声明，这是我博士学位的一部分.D. thesis.

Work Experience

Research Advisor

2022 - PRESENT

在线自由职业机构

调查、研究和记录软件中的缓存方法.
复制了最流行的缓存方法来预测研究论文中的生存时间.
建立了一个模拟器和强化学习模型，试图解决对象缓存的TTL预测问题.

Technologies: 机器学习，监督机器学习，强化学习, 深度强化学习, Data Science, NumPy

RAG/GPT4 Expert

2024 - 2024

Inflexion

改进了现有的基于rag的工具，以帮助团队更有效地搜索内部文档.
为不同类型的内容(电子邮件)建立文档处理系统, DOCX attachments, Excel电子表格, etc).
利用RAG实现了第一个版本的多题答题.

Technologies: 聊天语言，干草堆，自然语言处理(NLP)，机器学习, OpenAI GPT-4 API, Azure, 亚马逊网络服务(AWS), 检索增强生成(RAG), 生成预训练变压器(GPT)

技术博客作者

2023 - 2024

Agnostiq

写了几篇关于各种主题的技术博客，比如机器学习, 量子计算, cloud computing, 以及大型语言模型.
跨三个云提供商(AWS、Google cloud和Azure)实现可重复的工作流.
对开源工作流covalent库做出了贡献.

Technologies: 机器学习、Python、DevOps、数据科学、亚马逊网络服务(AWS), Azure, 谷歌云平台(GCP)

AI和ML开发人员

2023 - 2023

Aggieland软件

开发大型语言模型(LLM) LangChain bot生成软件需求.
构建并部署到云上的多进程应用程序通过API公开，该API可以与用户聊天以生成软件需求.
与两个团队合作，通过api集成LLM应用程序，提供web和移动应用程序访问LLM应用程序.

技术:人工智能(AI), Machine Learning, Azure机器学习, 大型语言模型(llm), Llama 2, FastAPI, LangChain

AI Expert

2023 - 2023

PD4 Solutions LLC

开发了一个基于llm的解决方案，以确定哪些科学文章与用户输入的自由文本标准相关.
评估了LLM解决方案的性能，并演示了证明比以前实现的解决方案有很大改进的指标.
与机器学习工程师一起部署解决方案并定义应用LLM解决方案的最佳架构.

技术:人工智能(AI), Machine Learning, Python, 自然语言处理(NLP), Language Models, 文本分类, 无监督学习, LangChain, 亚马逊网络服务(AWS), Git, GPT, Text Generation

高级数据科学家

2021 - 2023

Lionbridge自由撰稿人(通过Newfire Global Partners)

在文本数据上开发了一个机器学习序列标注模型，达到0以上.9 F1 score.
在不牺牲F1分数的情况下，减少了先前开发的机器学习模型的推理时间.
使用PySpark和Databricks执行大规模的数据分析，公司使用这些数据来推动未来的业务决策.
开发了多个高度可伸缩的Python web服务，这些服务目前正在为生产流量服务.

技术:Python, Agile, Scrum, Web Services, JSON, PyTorch, SpaCy, 自然语言工具包(NLTK), PySpark, Jupyter, Databricks, 开放神经网络交换(ONNX), Neural Networks, LSTM, Pandas, Data Science, NumPy, Git, 自然语言处理(NLP), Data Analysis, Azure Databricks

数据科学工程师

2022 - 2022

BJS

开发原型产品推荐，显示客户的购买模式.
构建简单的AWS Lambda函数来执行ETL工作流.
Worked with PySpark on large sets of data (>100GB of historical purchases).

技术:Python, Machine Learning, Spark ML, Scikit-learn, PySpark, 亚马逊网络服务(AWS), Git

机器学习工程师

2020 - 2021

Alchemy V Ltd(通过Toptal)

使用拥抱脸转换器/文本生成管道和客户提供的数据创建了一个营销口号文本生成器.
通过多个Google云服务BigQuery创建了一个数据摄取和报告流程, Cloud Functions, Cloud Endpoints, and Dataproc.
将现有的R报告代码移植到Python web服务中.

技术:Google Cloud, Google Cloud API, Google BigQuery, R, Python, Text Generation, SQL, Git

自然语言处理顾问

2020 - 2021

格兰维尔知识管理(通过Toptal)

开发了一个刮板下载一个大型(约20,000)和各种法律文件(1990年至今)从欧洲公共存储库.
利用机器学习构建文本分类模型，实现基于文档内容的自动分类.
创建了一个法律文件数据集，并使用它来训练和评估构建的机器学习文本分类模型. 通过谷歌协作共享结果，这样客户就可以用他们持有的数据交互地尝试模型的性能.

技术:Python, Scrapy, Web Scraping, PyTorch, Jupyter, 谷歌合作实验室(Colab), 文本分类, 自然语言处理(NLP)

研究助理

2018 - 2020

萨格勒布大学的实验室

开发了克罗地亚法律文件的搜索引擎.
结合LSTM和CRF，在PyTorch中构建了一个命名实体识别模型.
指导过几个学生做实习项目，并撰写了自然语言处理方面的硕士论文.

技术:Scikit-learn, PyTorch, Apache Solr, Django, Python, Torch, Pandas, Data Science, Git, 自然语言处理(NLP)

软件开发工程师

2014 - 2017

亚马逊网络服务(AWS)

用Java和c++开发了一个可伸缩的时间序列数据库解决方案, 它每秒处理大约100万个请求.
担任团队scrum主管和产品负责人.
设计并实现了一个网络关联引擎微服务来处理来自整个亚马逊网络的网络事件(专利授予http://patents).justia.com/inventor/filip-boltuzic).

技术:亚马逊网络服务(AWS), C++, Python, Java, Algorithms, Programming, Agile, Git, Web Services

商业智能分析师

2012 - 2014

萨格勒巴卡联合信贷银行集团

开发SQL报告，以确定数据仓库中有前景的零售策略.
用Java构建了一个交互式工具，以加快Oracle Data Integrator中的流程.
使用PL/SQL和Oracle Apex为会计部门开发小型web应用程序.

技术:Java, SQL，数据科学

Experience

克罗地亚法律文件搜索引擎

一个Django和Apache Solr web应用程序.

我是这个项目的首席开发人员，并提出了系统架构作为一组微服务. 文档在Solr中存储和索引, 而Django前端提供请求并与Solr通信.

零售额预测

该项目是设计一个基于历史订单数据预测销售数量的模型, previous sales, and regions. 预测是在区域和全球一级进行的，并作为时间序列预测事项. 我尝试了几种时间序列预测技术，如ARIMA和SARIMA模型.

Ulpian

http://ulpian.eu

为欧盟的法律专业人士开发了一个类似chatgpt的工具. 它允许用户通过源引用获得任何法律问题的答案. 它借鉴了国内官方法律文件、欧盟法律以及国内和欧盟判例法.

该工具目前正在一家名为Ulpian的初创公司开发中.

Education

2012 - 2020

Ph.D. 自然语言处理专业

萨格勒布大学-萨格勒布，克罗地亚

2010 - 2012

计算机科学硕士学位

萨格勒布大学-萨格勒布，克罗地亚

2010 - 2011

伊拉斯谟计算机科学交流学习

KTH皇家理工学院-斯德哥尔摩，瑞典

2007 - 2010

计算机科学学士学位

萨格勒布大学-萨格勒布，克罗地亚

Certifications

2017年11月至今

卷积神经网络

Coursera

Skills

Libraries/APIs

Scikit-learn, NumPy, Pandas, PyTorch, Google Cloud API, SpaCy, 自然语言工具包(NLTK), PySpark, LSTM, Spark ML

Tools

Vim Text Editor, Solr, Apache Solr, Git, Oh My Zsh, Boto, Jupyter, LaTeX, Azure机器学习, ChatGPT, Haystack

Languages

Python, SQL, Haskell, Java, c++， R

Paradigms

数据科学、异常检测、敏捷、Scrum、商业智能(BI)、DevOps

Storage

Elasticsearch, Google Cloud, JSON, PostgreSQL

Platforms

亚马逊网络服务(AWS)、Linux、Docker、Databricks、SolrCloud、Azure、谷歌云平台(GCP)

Frameworks

Django, Scrapy, streamlight

Other

自然语言处理(NLP), GPT, 生成预训练变压器(GPT), 人工智能(AI), Machine Learning, Back-end, OpenAI GPT-3 API, Data Analysis, Azure Databricks, 检索增强生成(RAG), 聚类算法, Clustering, 分类算法, 文本分类, Torch, Web Scraping, 谷歌合作实验室(Colab), Google BigQuery, Text Generation, Web Services, 开放神经网络交换(ONNX), Neural Networks, Research, 学生参与, 监督式机器学习, Time Series, 自回归综合移动平均线(ARIMA), LangChain, OpenAI, 强化学习, 深度强化学习, Algorithms, Programming, Heuristics, Optimization, 进化计算, 遗传算法, 卷积神经网络(CNN), 排序算法, 模式识别, Language Models, 无监督学习, Big Data, 非结构化数据分析, 大型语言模型(llm), Llama 2, FastAPI, 提示工程, OpenAI GPT-4 API, Pinecone, FAISS

有效的合作

如何使用Toptal

在数小时内，而不是数周或数月，我们的网络将为您直接匹配全球行业专家.

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.

选择你的才能

在24小时内获得专业匹配人才的简短列表，以进行审查，面试和选择.

开始你的无风险人才试验

与你选择的人才一起工作，试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring